読者です 読者をやめる 読者になる 読者になる

once upon a time,

Iris Tradをビール片手に聞くのが好きなエンジニアが、機械学習やRubyにまつわる話を書きます

word2vec可視化するやつをipython notebookから見れるようにした

オライリーから出てる、word2vec本の付録についてくる id:nishiohirokazu さんが書いた可視化のコードがあります。

word2vecのword-analogyを可視化した - 西尾泰和のはてなダイアリー

これを、ipython notebookから扱えるようにしました。

Visualizer word2vec data for ipython notebook

今回ipython notebookから使えるようにしたのは、厳密には上記のコードではなくて、こちらのコードなのですが、ある単語の周辺にある単語をPCAで2次元に縮退させて可視化してくれます。

大きくする

ipython notebookに関しての説明は、過去の記事を参照してください。

Docker上にnbviewerを立ててiruby+Nyaplotで描いたグラフを共有できるようにしてみた - once upon a time,

同じ要領で、ベクトルの引き算をした空間の可視化の奴もできると思います。

注意点としては、MacだとBoost.Pythonがsystem Pythonに対して入れなければならず(anacondaだと死にました)、ドはまりしたことでしょうか。 やはり、こうしたグラフをインタラクティブに生成するのはipython notebookの得意領域ですね