once upon a time,

Iris Tradをビール片手に聞くのが好きなエンジニアが、機械学習やRubyにまつわる話を書きます

machine learning

Cloudera World Tokyo 2016で機械学習プロダクトの作り方を話しました #cwt2016

さる11/8に、自社の主催するCloudera World Tokyo 2016で、機械学習プロダクトの作り方について話をしました。 図: Hadoopの生みの親 Doug(@cutting)と握力王新沼さん(@hiroki_niinuma)の対談イベントの様子 大規模データに対するデータサイエンスの進め方 #…

そのモデル、過学習してるの?未学習なの?と困ったら

Q: うわっ...ワタシのモデル過学習してる…? 機械学習をしていると、「やったほぼ100%の性能でました!」みたいな話がちょこちょこでて、その度に「あー、はいはい過学習乙」とか「leakageじゃね?」とかいう話になると思います。 過学習というのは、とても…

機械学習の分類の話を損失関数と決定境界を中心に整理してみた

機械学習の分類の話を、主に決定境界と損失関数の観点から整理してみました。 とはいっても、k-NNとか損失関数関係ないのもいます。 最初ははてなブログに書こうとしたのですが、数式を埋め込むのが辛かったのでjupyter notebookにしました。 github.com [追…

「データサイエンティスト養成読本 機械学習入門編」を読んだ

明日発売の「データサイエンティスト養成読本 機械学習入門編」を著者の一人の福島さん(@sfchaos)にいただきました。 きっかけは、福島さんが「機械学習ソフトウェアの外観」という特集でJuliaの紹介をしていただいたからでした。 データサイエンティスト養…

Machine Learning Casual Talks #3 (略称MLCT)やりました #MLCT

先日、Machine Learning Casual Talks #3を行いました。 togetterのまとめ 久しぶりのMLCTでしたが、今回も濃密な議論が行われました。 今回、発表資料を乗せるとともに、開催にあたってカジュアルとは、何故始めたか、を改めてお知らせしたので、それをこち…