読者です 読者をやめる 読者になる 読者になる

once upon a time,

Iris Tradをビール片手に聞くのが好きなエンジニアが、機械学習やRubyにまつわる話を書きます

Amazonで買ったThinkpad トラックポイント キーボードを修理した

みんな大好きトラックポイントキーボードですが、僕も昔使っていて最近miyagawaさんが使っていると知って再び使うようになりました。 今はThinkpadがIBMからLenovoに移管したので、故障などしたらLenovoに問い合わせる必要があります。 ですが、保証書には3…

Docker imageを用意してWindows/macOSでスムーズに同人誌を作った話(Sphinx編)

こんにちは、ハイラルに移住したchezouです。最近は、Rから始まりRで終わる言語をよく書いています。 いよいよ明日に迫ってきた技術書典2ですが、お-13で技術書供養寺として頒布を行います。 内容は、僕の機械学習の実務におけるtipsとfastFMを使った推薦、@…

Indigogo ではじめてバックして来た dot を使って3ヶ月がたった

最近のbackspace.fm でdotが「来る来る詐欺」でAir podsに完全に飲み込まれたという話が出ていたので、きちんとレビューしてなかったのを思い出したのでレビューします。 dotは一言で言うと、AirPodsみたいな小さいBluetoothイヤホンです。 https://www.indi…

また一つ年をとった

同い年のmirakuiさんがCTOになったりして、そろそろ組織に中で立ち回りが変わる年代なのかなと思ったりしてる。ちょうど一年前の今頃今の会社の面接を受け、初めての英語の契約書を1日2日で読んだりして、色々と慌ただしくしたところから首にならずに一年経…

Gitlab CIを使ってSphinxのドキュメントを自動でPDFにビルドする

gitlab.comは自前でDocker image登録できたり、CI持っていたりと便利ですね。しかも、privateレポジトリもお金かからないという太っ腹。 技術書典2に向けたレポジトリはgitlab.comで管理しています。 今回は共著者にPython使いが多いためSphinxを使って書い…

数式入りのmarkdownをSphinxを使ってhtml/pdfにする

Sphinxでmarkdown拡張を扱うためのrecommonmarkというライブラリがあります。 これを使うとreSTではなく、markdownを書いてhtmlやPDFが吐けるようになります。 詳細は以下のエントリにやり方がまとまっています。 tech.3rd-p-zombie.net 実は、このrecommonm…

macのJIS配列のキーボードをKarabiner使わずにUS配列にする

mac

macOS Sierraに上げる前に、Karabinerが動かない問題をなんとかしたいと思っていました。 El capitanでちゃんと検証してから上げないと、色んな人みたいに死ぬなと思ってKarabiner-Elementsに移行できるか検証しました。 今回の要件 JIS配列の本体のキーボー…

非英語ネイティブにとってのOSSのメンテナンスコスト

disclaimer: この記事を書いている人はClouderaというHadoop/Sparkのディストリビューターの会社にいます。 codelunch.fmの20回目を聞いていろいろ思うところがあったのでつらつら買いてみます。 codelunch.fm この回のcodelunch.fmでは、前職の同僚である丸…

2016年を振り返って

ブルガリアンスクワットをして筋肉痛でプルプルしています。大晦日も元旦もほぼDMM英会話の予定しかありません。 2016年は、世界的にも激動の年でしたが、個人的にも色々な大きなことが起こり激動の時代でした。*1 昨年の振り返りはこちらです。 chezou.hate…

2016年買ってよかったもの 10選

ハード中心ですが、2016年に買ってよかったものを書いていきます。10選と言いつつ、枝分かれをしているものがありますがご愛嬌ということで。転職をしたこともあり、必要となったものが大きく変わったのですが、今回は自分の生活を楽にしてくれたものを買え…

今年読んで面白かった漫画 2016年編

海外出張の移動やKindle Unlimitedとかもあって結構漫画を読む機会が多かったのですが、今年読んだ漫画のオススメを書いていきます。 買っているものと、マンガワンで一気読みしたものとあります。マンガワンはDAUを上げるための施策がよく出来ていて、12時…

#eigo と私〜あるいは子持ちの業務外活動の続け方

こんにちは、温泉行きたいです。この記事は、pyspaアドベントカレンダー2016の21日目です。1日前は、渋川さんの保険の話でした。 Clouderaという外資系のHadoop/Sparkを中心としたプラットフォームを提供する会社に今年転職しました。そこで生きていく上で必…

iPhone 6sのバッテリー交換には電話サポート+エクスプレス交換がオススメ

噂のiPhone 6sのバッテリー交換に当選しました。症状としては、突然電源断が起こるというもので、ちょいちょい突如落ちる現象には悩まされていました。 当選確認は、以下のサイトでシリアル番号をいれることで確認できます。 https://www.apple.com/jp/suppo…

Rubyで深層学習を使った音声合成Amazon Pollyを使ってWebサイトの読み上げ音声合成してみた

今日のre:InventでDeep Learningを使った音声合成サービスのAmazon Pollyが発表されました。 正直、DLを使ったの音声合成が話題になったのなんて今年に入ってからだと思っていたのに、もう商用化したんか!という気持ちでいっぱいです。 Amazon Polly – 文章…

icloudのカレンダーに来るイベントスパムを避けるための設定変更

最近、めちゃくちゃicloudのカレンダーにレイバンのスパムが来るようになってうざいので、通知されないように回避するためのicloudの設定方法を書いておく。 1. PCのブラウザでiCloud.com へ行きカレンダーを開く 2. 左下の歯車から環境設定を開く 3. 「詳細…

Cloudera World Tokyo 2016で機械学習プロダクトの作り方を話しました #cwt2016

さる11/8に、自社の主催するCloudera World Tokyo 2016で、機械学習プロダクトの作り方について話をしました。 図: Hadoopの生みの親 Doug(@cutting)と握力王新沼さん(@hiroki_niinuma)の対談イベントの様子 大規模データに対するデータサイエンスの進め方 #…

RNNLMベースの形態素解析器 JUMAN++ をhomebrewでインストールできるようにした

NLP

京大の黒橋・河原研から最近出たJUMAN++をmacOSのhomebrewでinstallできるようにしました。 JUMAN++はRNNLMというディープラーニングベースの言語モデルを使っています。 こちらの記事を読んで知ったという方も多いのではないでしょうか。 qiita.com インス…

PDFの表をpandasのDataFrameにできる tabula-py 作った

RubyKaigiに参加するとコード書きたいという気持ちが高まって良いのですが、今回はPDFの表を読み込んで pandas の DataFrame に変換できる tabula-pyを作りました。 これをもってRubyKaigiの参加報告とさせていただければと思います。 tabula-pyとは tabula …

川崎Ruby会議 01を開催しました #kwsk01

さる 8/20 に川崎Ruby会議01を開催しました。 regional.rubykaigi.org 川崎Ruby会議は、kawasaki.rbの主催する地域Ruby会議です。 ちゃんとしたまとめはるびまに出ると思うので、ここでは開催の経緯なんかを簡単に書こうと思います。 なお、発表内容が気にな…

「夏真っ盛り!Spark + Python + Data Science祭り」を開催しました&Ibisを紹介しました #summerDS

2016/07/25に「夏真っ盛り!Spark + Python + Data Science祭り」を開催しました。 connpass.com 今回はClouderaに入って初めてのコミュニティイベントということでしたが、なんと400人を超える応募をいただいてとてもありがたい限りです。 会場をご提供いた…

JupyterからSpark clusterを操作できるlivy + sparkmagicを試してみた

Spark Summit 2016でもトークがあったSparkのREST serverであるlivyですが、MicrosoftがHDInsight上のSpark clusterとJupyterをlivyを使って繋げられるようにしたと聞いて、早速試してみました。 Jupyterって何?という方は簡単に言うと、ブラウザで各種言語…

そのモデル、過学習してるの?未学習なの?と困ったら

Q: うわっ...ワタシのモデル過学習してる…? 機械学習をしていると、「やったほぼ100%の性能でました!」みたいな話がちょこちょこでて、その度に「あー、はいはい過学習乙」とか「leakageじゃね?」とかいう話になると思います。 過学習というのは、とても…

機械学習の分類の話を損失関数と決定境界を中心に整理してみた

機械学習の分類の話を、主に決定境界と損失関数の観点から整理してみました。 とはいっても、k-NNとか損失関数関係ないのもいます。 最初ははてなブログに書こうとしたのですが、数式を埋め込むのが辛かったのでjupyter notebookにしました。 github.com [追…

データを一箇所に集めることでデータ活用の民主化が進んだ話

先日、この記事を読んで分析のハードルを下げること大事だよね、というのを思い出したのでつらつらと書いてみようと思います。 qiita.com 内容としては正直タイトル詐欺で、SlackからRDSにクエリ発行できるようにして、各種権限を持っているエンジニアでなく…

転職しました

はじめての転職エントリです。 一部の方にはお伝えしましたが、先週からClouderaで働いています。 まとめ Ruby大好きポエム プロダクトエンジニアポエム データ大好きポエム お前だれよ? kawasaki.rbやMachine Learning Casual Talks、Julia Tokyoなどのミ…

#CookpadTechConf 2016でクックパッドの研究まわりの取り組みを発表しました

1/23に開催されたCookpad TechConf 2016で、クックパッドの研究開発に関する取り組みを紹介させていただきました。 R&D at Foodtech company - #CookpadTechConf 2016 from Michiaki Ariga www.slideshare.net メッセージとして伝えたかったことは、 たべみ…

2015年を振り返って

今年は色々と挑戦をし、成功したもの失敗したもの多くの体験ができました。 雑感 その中で痛感したのが、背中を預けられる仲間と働くことの重要性でした。 通年を通じて会社の同僚に散々言われつづけてきた2つの言葉があります。 責任を取らない人の言葉は気…

2015年に買ってよかった物まとめ

書いておくと後から検索できることもあり、今年買ってよかったものを書いていこうと思います。 1. 防水Bluetoothスピーカー Patech Bluetooth 3.0 ワイヤレススピーカー 内蔵マイク付 吸盤式対応 防水仕様 (ブラック)出版社/メーカー: Patechメディア: エ…

Julia Tokyo #5を開催しました #JuliaTokyo

さる12/19にJuliaTokyoの第五回を開催しました。*1 togetterのまとめはこちら。 togetter.com 資料はまだいくつかしかアップロードされていませんが、今回は機械学習の話やDeep Learningの話が多かったように思います。 juliatokyo.connpass.com 個人的に印…

Juliaで得られたマイナー言語を盛り上げる方法 #JuliaAC

この記事はJulia Advent Calender 2015の最終日です。 Juliaは大分マイナーな言語で、日本語による情報が殆ど無かったのですが、以下の要因で大分盛り上がってきていると思います。 イベント(JuliaTokyo)を年数回開催している Advent Calendarを毎年開催し…

Machine Learning Casual Talks #4 を開催しました #MLCT

まさかの一週間内に自分の主催する勉強会が3回重なるデスロードを走ってきたchezouです。*1 前回からだいぶ感覚があきましたが、MLCTを @yamakatu さんの火付けのもと開催しました。*2 mlct.connpass.com テーマは @tokoroten さん発案のDevOpsをもじった"De…

小さい子供が自分から薬を飲みたくなる「おくすり飲めたね」 #childadvent

この記事は子育てプログラマ・ITエンジニア・Webデザイナー Advent Calendar 2015 - Adventarの21日目の記事です。 前日は、@ksssさんの子育てしながらリモートで働いた半年間 - スペクトラムでした。 今回はまったくテクノロジーの話をしません。*1 1行で …

Juliaの情報を収集しつづけるには

この記事はJulia Advent Calendar 2015 の10日目です。 昨日は、bicycle1885さんのJuliaのユニットテスト - りんごがでているでした。 Juliaは変化が速い言語なため、最新の情報を追い続けるのが必要な言語です。 しかし、初心者にはその変化の速さになかな…

どんな子供も好きになる、「うーやん」を広めるたった1つの方法

このエントリは、お子さん、どんな本読んでる? Advent Calendar 2015 - Adventar の6日目です。 「うーやん」とは? うどんです。 本の正式名称は「うどんのうーやん」です。 「うーやん」とは? 働き者のうどんです。 人手不足の煽りを受けて、自分自身で…

SympyとJupyter notebookで数式のメモを取ろう

id:meison_amsl さんによるSympyの紹介がとてもよい感じだったのですが、Sympy Liveわざわざ使わなくてもJupyter notebook使えるのでは!?と思ったので試してみました。*1 わざわざ、というと語弊があると思いますが、手元でメモ+αとして管理するのにはJup…

IDCFクラウドの500円サーバーでpodcast serverをはじめて8ヶ月が経ちました

どうも、最近PSYCHO-PASSを見終わってシュタインズ・ゲートを見ています。 この記事はIDCFクラウド1周年キャンペーンを応援する記事です。*1 Rubyistといろいろなことを話すpodcast rubyist.club をはじめて半年経ちました。 最近リリース前のドタバタでご無…

TinySegmenter.jlをGoと比較して負けたと思ったら若者が最適化してくれた

先日、TinySegmenter.jlの話を書いたら各方面から反響を頂きました。 repeatedly.github.io http://woxtu.tumblr.com/post/132337169740/rust-tinysegmenterwoxtu.tumblr.com qiita.com そんな中で、ikawahaさんがGoでも同様の最適化を実装していました。 ik…

Amazon Fire TV Stickを買ったらApple TV+ChromeCast-ちょっとになった

Amazon Fire TV StickをPrime会員割引で\1980で買いました。(定価は\4980) Fire TV Stick出版社/メーカー: Amazon発売日: 2015/10/28メディア: エレクトロニクスこの商品を含むブログ (11件) を見る なぜFire TV Stickを買ったかというと 安かった iOS/Andr…

「ネットフリックスの時代」にはコンテンツの山に埋もれなさせないためのヒントが詰まっていた

backspace.fmでもよくゲストに出ている西田宗千佳さん(@mnishi41)の書かれた、「ネットフリックスの時代−配信とスマホがテレビを変える」読んだ。 ネットフリックスの時代 配信とスマホがテレビを変える (講談社現代新書)作者: 西田宗千佳出版社/メーカー: …

TinySegmenterをJulia移植したらMITの先生に指導してもらえた話

先日、工藤さんがJavaScript向けに作った日本語のコンパクトな分かち書きツール、TinySegmenterをJuliaに移植したTinySegmenter.jlを作りました。 もともとは、PyconJPでjanomeの話を聞いたら居ても立っても居られなくなって、簡単なTinySegmenterを移植した…

バッキバキになっていたNexus5を$40で修理した

Ingress をやるときに自転車のマウンタから飛んでしまってバキバキになってしまったNexus5。 大きい画面でKindleも読みやすい!と言っていたけど、ガラスが割れてから使用率がぐっと下がっていました。 Googleプレイ版は修理するのに三万円近くするというの…

PyConJP 2015に参加した #pyconjp

はじめてPyConJPに参加してきました。 スライドまとめは以下が詳しいです。 techstars.jp 最近、会社ではJupyter notebookの伝道師として振る舞っており*1、その結果として空前のpandasブームを巻き起こしました。 データ分析/機械学習といえばPythonだよね…

IIJmioの「おうちでナンバーポータビリティ」使って自宅でMNPした

IIJmioのファミリーシェアプランにSIMを追加する際に、9/16に始まっていた「おうちでナンバーポータビリティ」を使ってみました。 www.iijmio.jp おうちでナンバーポータビリティの流れ IIJmioあるあるなのが、ドキュメントがしっかりしていなくてやり方がい…

吸盤付きお風呂スピーカーがPodcast聞くのにすごい便利

前々からBluetoothのお風呂ラジオをほしいなーと思っていたのですが、昔に比べるとかなり安くなっていたので買いました。 Patech Bluetooth 3.0 ワイヤレススピーカー 内蔵マイク付 吸盤式対応 防水仕様 (ブルー)出版社/メーカー: Patechメディア: エレク…

MeCab.jlをJulia v0.4.0-rc2に対応した

ついに、Julia v0.4.0-rc2が2015/9/19出ましたね! Dictの[:symbol => :value]といったsyntax sugarがなくなったりして、自分が作っているMeCab.jlでも対応をしました。 詳細はPRを見ていただければと思いますが、Compat.jlを使えば基本OKです。 github.com …

「データサイエンティスト養成読本 機械学習入門編」を読んだ

明日発売の「データサイエンティスト養成読本 機械学習入門編」を著者の一人の福島さん(@sfchaos)にいただきました。 きっかけは、福島さんが「機械学習ソフトウェアの外観」という特集でJuliaの紹介をしていただいたからでした。 データサイエンティスト養…

#tqrk09 で Accept LT してはじめての Gem をライブリリースに失敗しました

Tokyu Ruby Kaigi 09 でAccept LTのトリで話しました。 3分だってのに盛りすぎ、かつDEMOで接続が悪くなるという前回もあった失敗を重ねてはじめてのGemをライブリリースすることに失敗しました。 なお、カリーヴルストは無事リリースできました。 instagram…

YAPC::ASIA Tokyo 2015参加してきた #yapcasia

初参加にして最後のYAPC::ASIA Tokyoに行ってきた。 イベント開催したい熱が高まった コード書きたい気持ちが高まったので、Mykytea-rubyのgem化を進めた 意外とはじめての参加でもぼっちにならずに済んで良かった 聞いた PHP帝国の逆襲!(を願うPHPerが話…

Apple Music のプレイリストを中心としたレコメンド戦略

膨大な音楽というコンテンツの海に放り出された時に、人は何をするだろうか。 今回Apple Musicをさわってみて、様々な路線から音楽との出会いをつくろうとしているな、と感じたのでまとめておく。 きっと、Apple Musicについてその辺の話がbackspace.fmで出…

日本人向けPodcastやるならIDCFクラウドが良さそう

rubyist.clubというpodcastをやっているのですが、IDCFクラウドの上で動いています。 tl;dr IDCFクラウド月500円で3TBまで転送量無料なので、国内向けPodcastには便利 いいところ 安いこと。 IDCFクラウドは、一番小さいインスタンスなら月500円で使えて月3T…