once upon a time,

Iris Tradをビール片手に聞くのが好きなエンジニアが、機械学習やRubyにまつわる話を書きます

python

PDFの表をpandasのDataFrameにできる tabula-py 作った

RubyKaigiに参加するとコード書きたいという気持ちが高まって良いのですが、今回はPDFの表を読み込んで pandas の DataFrame に変換できる tabula-pyを作りました。 これをもってRubyKaigiの参加報告とさせていただければと思います。 tabula-pyとは tabula …

TinySegmenterをJulia移植したらMITの先生に指導してもらえた話

先日、工藤さんがJavaScript向けに作った日本語のコンパクトな分かち書きツール、TinySegmenterをJuliaに移植したTinySegmenter.jlを作りました。 もともとは、PyconJPでjanomeの話を聞いたら居ても立っても居られなくなって、簡単なTinySegmenterを移植した…

PyConJP 2015に参加した #pyconjp

はじめてPyConJPに参加してきました。 スライドまとめは以下が詳しいです。 techstars.jp 最近、会社ではJupyter notebookの伝道師として振る舞っており*1、その結果として空前のpandasブームを巻き起こしました。 データ分析/機械学習といえばPythonだよね…

「データサイエンティスト養成読本 機械学習入門編」を読んだ

明日発売の「データサイエンティスト養成読本 機械学習入門編」を著者の一人の福島さん(@sfchaos)にいただきました。 きっかけは、福島さんが「機械学習ソフトウェアの外観」という特集でJuliaの紹介をしていただいたからでした。 データサイエンティスト養…

pip install kyteaできるようになりました

先月のkawasaki.rbで、Rubyistなのにgemより先にPypiデビューしましたという話をしました。 Rubyistがgemの前にPypiデビューするのは間違っているだろうか from 康顕 有賀 www.slideshare.net 中身は、kyteaをpipから入れられるようにしたよということですが…