くまちゃんのiOS/Androidゲームプログラミング

マイペースでゲームつくってます。

マシンラーニングやってみた

ゲームプログラミングは忘れていないのですが...

いや〜、ホントに驚きましたよ。
パソコンの前でブルッとした、もしくはゾクッとしたのって、いままであったかしらん?
今取り組んでいる言語処理ですが、少し前にTwitterから18,000件を取得することはできるようになって、次は解析だけどまずは頻出語を数えるところからですかね...と言っていたのが、なんともう解析して、その内容に応じて分類するところまでできてしまいました。
もう、あっという間に18,000件ものツイート全件の言葉を解析して、それを分類してしまったのです。
写真では伝えきれないのですが、ずらーっと18,000件が内容ごとにまとめられているのは壮観です。
例えば、65番(分類ごとの番号)は、魚の知能のニュースで分類されており、次の66番はEXPOCITYのニュースで分類されています。
これ、一番単純なのはエクセルで並べ替えを思い浮かべてもらえればいいのですが、最初の文字コード順の並べ替えでは絶対こうはならないんですよ。文章の中の語と語の関係性を計算しているんです。
これが機械学習、英語で言うML(Machine Learning)という技術というかプログラムでして。
もちろん、技術の詳細や理論的なことは相当深く勉強しないと歯が立たなくて、tf-idf、モホロビチッチ不連続面Latent Semantic Analysis (LSA, 潜在意味解析)とか「は?」ってなもんです。
ただ、実際にこうして個人が所有する目の前のパソコンでも、計算した結果を弾き出したのを見せつけられると、「ここまで来たか...」と思わずにはおられんのですよ、30年前からのマイコン少年としては。
f:id:tadakazu1972:20150809201103p:plain