Windows上のPythonからMeCabを利用する
以前言語処理では形態素解析(文章を最小構成単位に分割し、情報を与えること)という処理が重要になります。 形態素解析には、京都大学と日本電信電話株式会社が共同開発したMeCabというオープンソース形態素解析エンジンが非常に… 続きを読む »
以前言語処理では形態素解析(文章を最小構成単位に分割し、情報を与えること)という処理が重要になります。 形態素解析には、京都大学と日本電信電話株式会社が共同開発したMeCabというオープンソース形態素解析エンジンが非常に… 続きを読む »
前回、CIFAR-10の画像データを試しに1枚表示してみました。 今後、この素晴らしいデータ群を、より応用的に参照できるようにするために、データの形式をより詳しく知りたいと思います。 格納されているデータの… 続きを読む »
機械学習では学習用に多くのデータを用意する必要がありますが、画像データを公開しているサイトの一つにCIFAR-10というものがあります。 ここには32×32サイズの画像データが60,000件あります。 画像は10種類のカ… 続きを読む »
手書き文字の豊富なデータとしてMNISTデータがありますが、今回はMNISTデータを機械学習し、文字を予測してみたいと思います。 アルゴリズムの選定 使用するアルゴリズムは、scikit-learnのアルゴ… 続きを読む »
機械学習のフレームワークであるscikit-learnライブラリを用いて、日経平均株価を予測してみたいと思います。 LinearRegressionという線形回帰モデルによって実現することにします。 まず、… 続きを読む »