once upon a time,

Iris Tradをビール片手に聞くのが好きなエンジニアが、機械学習やRubyにまつわる話を書きます

Amazonで買ったThinkpad トラックポイント キーボードを修理した

みんな大好きトラックポイントキーボードですが、僕も昔使っていて最近miyagawaさんが使っていると知って再び使うようになりました。 今はThinkpadがIBMからLenovoに移管したので、故障などしたらLenovoに問い合わせる必要があります。 ですが、保証書には3…

Docker imageを用意してWindows/macOSでスムーズに同人誌を作った話(Sphinx編)

こんにちは、ハイラルに移住したchezouです。最近は、Rから始まりRで終わる言語をよく書いています。 いよいよ明日に迫ってきた技術書典2ですが、お-13で技術書供養寺として頒布を行います。 内容は、僕の機械学習の実務におけるtipsとfastFMを使った推薦、@…

Indigogo ではじめてバックして来た dot を使って3ヶ月がたった

最近のbackspace.fm でdotが「来る来る詐欺」でAir podsに完全に飲み込まれたという話が出ていたので、きちんとレビューしてなかったのを思い出したのでレビューします。 dotは一言で言うと、AirPodsみたいな小さいBluetoothイヤホンです。 https://www.indi…

また一つ年をとった

同い年のmirakuiさんがCTOになったりして、そろそろ組織に中で立ち回りが変わる年代なのかなと思ったりしてる。ちょうど一年前の今頃今の会社の面接を受け、初めての英語の契約書を1日2日で読んだりして、色々と慌ただしくしたところから首にならずに一年経…

Gitlab CIを使ってSphinxのドキュメントを自動でPDFにビルドする

gitlab.comは自前でDocker image登録できたり、CI持っていたりと便利ですね。しかも、privateレポジトリもお金かからないという太っ腹。 技術書典2に向けたレポジトリはgitlab.comで管理しています。 今回は共著者にPython使いが多いためSphinxを使って書い…

数式入りのmarkdownをSphinxを使ってhtml/pdfにする

Sphinxでmarkdown拡張を扱うためのrecommonmarkというライブラリがあります。 これを使うとreSTではなく、markdownを書いてhtmlやPDFが吐けるようになります。 詳細は以下のエントリにやり方がまとまっています。 tech.3rd-p-zombie.net 実は、このrecommonm…

macのJIS配列のキーボードをKarabiner使わずにUS配列にする

mac

macOS Sierraに上げる前に、Karabinerが動かない問題をなんとかしたいと思っていました。 El capitanでちゃんと検証してから上げないと、色んな人みたいに死ぬなと思ってKarabiner-Elementsに移行できるか検証しました。 今回の要件 JIS配列の本体のキーボー…

非英語ネイティブにとってのOSSのメンテナンスコスト

disclaimer: この記事を書いている人はClouderaというHadoop/Sparkのディストリビューターの会社にいます。 codelunch.fmの20回目を聞いていろいろ思うところがあったのでつらつら買いてみます。 codelunch.fm この回のcodelunch.fmでは、前職の同僚である丸…

2016年を振り返って

ブルガリアンスクワットをして筋肉痛でプルプルしています。大晦日も元旦もほぼDMM英会話の予定しかありません。 2016年は、世界的にも激動の年でしたが、個人的にも色々な大きなことが起こり激動の時代でした。*1 昨年の振り返りはこちらです。 chezou.hate…

2016年買ってよかったもの 10選

ハード中心ですが、2016年に買ってよかったものを書いていきます。10選と言いつつ、枝分かれをしているものがありますがご愛嬌ということで。転職をしたこともあり、必要となったものが大きく変わったのですが、今回は自分の生活を楽にしてくれたものを買え…

今年読んで面白かった漫画 2016年編

海外出張の移動やKindle Unlimitedとかもあって結構漫画を読む機会が多かったのですが、今年読んだ漫画のオススメを書いていきます。 買っているものと、マンガワンで一気読みしたものとあります。マンガワンはDAUを上げるための施策がよく出来ていて、12時…

#eigo と私〜あるいは子持ちの業務外活動の続け方

こんにちは、温泉行きたいです。この記事は、pyspaアドベントカレンダー2016の21日目です。1日前は、渋川さんの保険の話でした。 Clouderaという外資系のHadoop/Sparkを中心としたプラットフォームを提供する会社に今年転職しました。そこで生きていく上で必…

iPhone 6sのバッテリー交換には電話サポート+エクスプレス交換がオススメ

噂のiPhone 6sのバッテリー交換に当選しました。症状としては、突然電源断が起こるというもので、ちょいちょい突如落ちる現象には悩まされていました。 当選確認は、以下のサイトでシリアル番号をいれることで確認できます。 https://www.apple.com/jp/suppo…

Rubyで深層学習を使った音声合成Amazon Pollyを使ってWebサイトの読み上げ音声合成してみた

今日のre:InventでDeep Learningを使った音声合成サービスのAmazon Pollyが発表されました。 正直、DLを使ったの音声合成が話題になったのなんて今年に入ってからだと思っていたのに、もう商用化したんか!という気持ちでいっぱいです。 Amazon Polly – 文章…

icloudのカレンダーに来るイベントスパムを避けるための設定変更

最近、めちゃくちゃicloudのカレンダーにレイバンのスパムが来るようになってうざいので、通知されないように回避するためのicloudの設定方法を書いておく。 1. PCのブラウザでiCloud.com へ行きカレンダーを開く 2. 左下の歯車から環境設定を開く 3. 「詳細…

Cloudera World Tokyo 2016で機械学習プロダクトの作り方を話しました #cwt2016

さる11/8に、自社の主催するCloudera World Tokyo 2016で、機械学習プロダクトの作り方について話をしました。 図: Hadoopの生みの親 Doug(@cutting)と握力王新沼さん(@hiroki_niinuma)の対談イベントの様子 大規模データに対するデータサイエンスの進め方 #…

RNNLMベースの形態素解析器 JUMAN++ をhomebrewでインストールできるようにした

NLP

京大の黒橋・河原研から最近出たJUMAN++をmacOSのhomebrewでinstallできるようにしました。 JUMAN++はRNNLMというディープラーニングベースの言語モデルを使っています。 こちらの記事を読んで知ったという方も多いのではないでしょうか。 qiita.com インス…

PDFの表をpandasのDataFrameにできる tabula-py 作った

RubyKaigiに参加するとコード書きたいという気持ちが高まって良いのですが、今回はPDFの表を読み込んで pandas の DataFrame に変換できる tabula-pyを作りました。 これをもってRubyKaigiの参加報告とさせていただければと思います。 tabula-pyとは tabula …

川崎Ruby会議 01を開催しました #kwsk01

さる 8/20 に川崎Ruby会議01を開催しました。 regional.rubykaigi.org 川崎Ruby会議は、kawasaki.rbの主催する地域Ruby会議です。 ちゃんとしたまとめはるびまに出ると思うので、ここでは開催の経緯なんかを簡単に書こうと思います。 なお、発表内容が気にな…

「夏真っ盛り!Spark + Python + Data Science祭り」を開催しました&Ibisを紹介しました #summerDS

2016/07/25に「夏真っ盛り!Spark + Python + Data Science祭り」を開催しました。 connpass.com 今回はClouderaに入って初めてのコミュニティイベントということでしたが、なんと400人を超える応募をいただいてとてもありがたい限りです。 会場をご提供いた…

JupyterからSpark clusterを操作できるlivy + sparkmagicを試してみた

Spark Summit 2016でもトークがあったSparkのREST serverであるlivyですが、MicrosoftがHDInsight上のSpark clusterとJupyterをlivyを使って繋げられるようにしたと聞いて、早速試してみました。 Jupyterって何?という方は簡単に言うと、ブラウザで各種言語…

そのモデル、過学習してるの?未学習なの?と困ったら

Q: うわっ...ワタシのモデル過学習してる…? 機械学習をしていると、「やったほぼ100%の性能でました!」みたいな話がちょこちょこでて、その度に「あー、はいはい過学習乙」とか「leakageじゃね?」とかいう話になると思います。 過学習というのは、とても…

機械学習の分類の話を損失関数と決定境界を中心に整理してみた

機械学習の分類の話を、主に決定境界と損失関数の観点から整理してみました。 とはいっても、k-NNとか損失関数関係ないのもいます。 最初ははてなブログに書こうとしたのですが、数式を埋め込むのが辛かったのでjupyter notebookにしました。 github.com [追…

データを一箇所に集めることでデータ活用の民主化が進んだ話

先日、この記事を読んで分析のハードルを下げること大事だよね、というのを思い出したのでつらつらと書いてみようと思います。 qiita.com 内容としては正直タイトル詐欺で、SlackからRDSにクエリ発行できるようにして、各種権限を持っているエンジニアでなく…

転職しました

はじめての転職エントリです。 一部の方にはお伝えしましたが、先週からClouderaで働いています。 まとめ Ruby大好きポエム プロダクトエンジニアポエム データ大好きポエム お前だれよ? kawasaki.rbやMachine Learning Casual Talks、Julia Tokyoなどのミ…

#CookpadTechConf 2016でクックパッドの研究まわりの取り組みを発表しました

1/23に開催されたCookpad TechConf 2016で、クックパッドの研究開発に関する取り組みを紹介させていただきました。 R&D at Foodtech company - #CookpadTechConf 2016 from Michiaki Ariga www.slideshare.net メッセージとして伝えたかったことは、 たべみ…

2015年を振り返って

今年は色々と挑戦をし、成功したもの失敗したもの多くの体験ができました。 雑感 その中で痛感したのが、背中を預けられる仲間と働くことの重要性でした。 通年を通じて会社の同僚に散々言われつづけてきた2つの言葉があります。 責任を取らない人の言葉は気…

2015年に買ってよかった物まとめ

書いておくと後から検索できることもあり、今年買ってよかったものを書いていこうと思います。 1. 防水Bluetoothスピーカー Patech Bluetooth 3.0 ワイヤレススピーカー 内蔵マイク付 吸盤式対応 防水仕様 (ブラック)出版社/メーカー: Patechメディア: エ…

Julia Tokyo #5を開催しました #JuliaTokyo

さる12/19にJuliaTokyoの第五回を開催しました。*1 togetterのまとめはこちら。 togetter.com 資料はまだいくつかしかアップロードされていませんが、今回は機械学習の話やDeep Learningの話が多かったように思います。 juliatokyo.connpass.com 個人的に印…

Juliaで得られたマイナー言語を盛り上げる方法 #JuliaAC

この記事はJulia Advent Calender 2015の最終日です。 Juliaは大分マイナーな言語で、日本語による情報が殆ど無かったのですが、以下の要因で大分盛り上がってきていると思います。 イベント(JuliaTokyo)を年数回開催している Advent Calendarを毎年開催し…