once upon a time,

Iris Tradをビール片手に聞くのが好きなエンジニアが、機械学習やRubyにまつわる話を書きます

program

非英語ネイティブにとってのOSSのメンテナンスコスト

disclaimer: この記事を書いている人はClouderaというHadoop/Sparkのディストリビューターの会社にいます。 codelunch.fmの20回目を聞いていろいろ思うところがあったのでつらつら買いてみます。 codelunch.fm この回のcodelunch.fmでは、前職の同僚である丸…

Docker上にnbviewerを立ててiruby+Nyaplotで描いたグラフを共有できるようにしてみた

昨年末に@domitryさんが書かれた記事でも話題になった、RubyのライブラリMikonとNyaplotで生成したグラフをipython notebookとして社内のGHEでも共有することを目標に、nbviewerをlocalのdocker上で立ててみました。 ちなみに、1/10のyokohama.rbでモクモク…

RubyKaigi行ってきました & RubyHirobaで「神奈川Ruby会議01」告知LTしてきました #rubykaigi #rubyhiroba #kana01

いっぱい面白い発表があったけど、諸般の事情により完結にRubyKaigi "Inside RubyMotion for Android"がやばかった。まさか、REPLを使ってAndroidのviewを動的に変更しているデモを見られるとは @tmm1氏の"Ruby 2.1 in Production"がとにかく"Profile! Profi…

MeCabのJuliaバインディングMeCab.jlを作りました

Juliaから日本語形態素解析器として最も有名なMeCabを使えるMeCab.jlを作りました。まだ、METADATA.jlにマージされていないのですが、きっと明日には使えるようになっていると思います。 [2014/09/15 23:33追記] マージされました!How to use簡単な使い方は…

#JuliaTokyo 01で「Julia100本ノック」を発表してきました

JuliaTokyo 01で発表してきました。 取りまとめをしてくださった @sorami さんには感謝です。事の発端は、Julia vs Pythonを読んだ@bicycle1885とMachine Learning Casual Talksで「Julia勉強会やりましょう!」といったことでした。 そこで、Tokyo.RでRをdi…

Julia100本ノック

Julia vs Python: ビットコインオプションのモンテカルロシミュレーションに引き続き、100 numpy exercisesという、面白いnumpyの練習問題があったのでそれのJulia版を作成しました。 実際には46個しかないのと、numpyの便利関数がなくて挫折したものとかい…

「はじめてのパターン認識」読書会に参加しました #はじパタ

先日開催された第12回「はじめてのパターン認識」読書会に@yamakatuさんに誘われるままに参加してきました。部分空間法の話の続きとカーネル主成分分析分析のお話が中心でした。この本、タイトルはやさしそうな雰囲気を出していながら、普通に数式をきちんと…

科学計算における均質化、あるいはなぜPythonが着実に他言語のシェアを奪っているか

最近、何故科学計算でPythonがほぼ一人勝ちなのか気になっていたのですが、TAL YARKONI氏による、THE HOMOGENIZATION OF SCIENTIFIC COMPUTING, OR WHY PYTHON IS STEADILY EATING OTHER LANGUAGES’ LUNCHという記事が、その答えに近づける鍵なのかもしれな…

Kawasaki.rb #001 第1回ミートアップを開催しました #kwskrb

6/26にKawasaki.rbの第1回ミートアップを開催しました。Kawasaki.rb #001ありそうで以外となかった、川崎でのRubyの勉強会です。 初心者からコアな人までざっくばらんに話が出来ればと思って始めました。 Doorkeeperの参加者を見ていただくとわかるのですが…

Autopagerize-rubyのMechanize版を作った

Qiitaにも書いたけど、Ruby向けAutopagerizeをMechanize対応してみた。https://github.com/chezou/autopagerize-ruby/tree/mechanized特徴はMechanizeのrobots.allowをそのまま流用できること。 それ以外は正直httpclientの方が早いと思います。いまいちよく…

パワーポイントに色づけしたソースコードを簡単に貼る方法

パワーポイントに色づけしたコードを貼るのって、皆どうやってるのか不思議に思っていたのですが、どれもちょっと面倒だなという感じでした。 GNU Source-highlightを使う方法:覚え書き:色づけしたソースコードをPowerPointなどに貼り付ける方法 - C++Buil…

Websocketを使ってリアルタイムに形態素解析をするmorph-websocketを作ってみた

[caption id="attachment_1461" align="aligncenter" width="500"] morph-websocket画面[/caption]WebSocketを使ってリアルタイムに形態素解析結果を出力する、morph-websocketを作りました。テキストボックスに入力すると、リアルタイムで形態素解析結果が…

pficommonのpfi::text::jsonでシリアライズ/ デシリアライズしてみた

@unnonounoさんが紹介してくださったpficommonのjsonライブラリを試してみました。 pficommonのjsonライブラリはboostみたいにjsonと自分で作ったクラスのオブジェクトとのシリアライズ/デシリアライズができるのがとても魅力です。 その一方で、結構ドキュ…

Mercurialと親和性の高いリポジトリブラウザRhodeCodeをインストールしてみた

Mercurialと連動するブラウザベースのリポジトリ管理システム、RhodeCodeを導入したのでその際のメモを書き残します。 一言で言うと、githubみたいなものを社内などで運用したいというニーズに応えるものです。 gitlabとかも試してみましたが、ドツボにはま…

正規表現ライブラリre2の簡単な使い方まとめ

先日、インストールして試してみたGoogle製正規表現エンジンre2。シンプルな使い方は、前の記事を見ていただければ分かると思うのですが、色々やってみようと思った時に、意外と独特の癖があってやりたいことをやるのに少し手間取ったので、メモがてらまとめ…

Google製の正規表現エンジンRe2を日本語で試してみた

C++で正規表現を使う時、boost::regexを使うことが多いと思っていたのですが、何故か1.46.1以降(といっても1.48.0しか試していませんが)、regex_search,regex_matchがNullPointerExceptionぽく落ちるので、解決方法を探していました。そこで、試してみたのが…

cJumanのインストールをちょっと簡単にするcJuman-installer

cJumanという@kharakawa さんの作成された、形態素解析器Jumanをpythonから使うためのSWIGで作られたラッパーがあります。python-cjuman: A Python (SWIG) bindings of JUMAN, A Japanese Morphological Analyzer「入門自然言語処理」でも紹介されているので…

KyTeaを他言語で使うラッパー+αまとめ

@neubigさんの作られたKyTeaを他言語で利用できるラッパーですが、 拙作のMykytea意外にも色々とあるようなのでまとめておきます。KyTeaって何?って人は本家やこちらの@nokunoさんの記事がわかりやすいですが、 一言で言うと形態素解析や読みの推定を行って…

NLTKからKyTeaでコーパスを読み込むJPKyteaTokenizer作りました

KyteaをPythonから使うMykytea-pythonを使って、NLTKラッパーを書いてみました。NLTKって?NLTKといえば、オライリーでも「入門 自然言語処理」という日本語の書籍が出ているくらいメジャーなPythonの自然言語処理用ライブラリです。ちなみに、日本語の処理…

sinatraでKyTeaをブラウザから試すkytea-sinatra作ってみた

先日のエントリで書いたとおりMykytea-rubyを使って、試しにブラウザから解析結果をみられるkytea-sinatraを作りました。といっても、sinatraとhamlを使ってちょっと出力結果を見られるようにしたのシンプルなものです。 イメージとしては、このような形でブ…

KyTea:京都テキスト解析ツールキット をRuby, Pythonから使えるMykyteaを作ってみた

[2011/07/23追記] SWIGで生成したmykytea_wrap.cxxをgithubに追加したので、SWIGのインストールは必要なくなりました。それに伴い実行すべき事が当初と変わっています。KyTeaという@neubigさんが作られた、テキストの形態素解析や読み付与ができるツールがあ…

MeCabをRuby 1.9.2 on Windows7(64bit版)で使う方法

Windows7の開発環境を構築するに当たって、なんとなくRubyを1.8.7から1.9.2にしてみました。 そしたら意外とx64でMeCabを使えるようになるまでにハマったのでメモしておきます。 Makefileとかよく分からないなりに頑張ったのですが、かなりいい加減だと思い…