六本木で働くデータサイエンティストのブログ

元祖「銀座で働くデータサイエンティスト」です / 道玄坂→銀座→東京→六本木

初めてこのブログに来た方へ

これは初めてこのブログに来た方々向けのトップ固定記事です。最新記事の更新状況に応じて随時更新されます。

id:TJOとは何者なのか


データサイエンティスト・機械学習人工知能)エンジニアとは何か

データ分析を仕事にしたければ読むべき本は何か

続きを読む

「データサイエンティスト」「人工知能」「AI(トピックス)」のGoogleトレンドから向こう1年間のブーム動向を占ってみる

f:id:TJO:20190319173654p:plain
(Google Trends)

最近時系列分析あまりやってないので、{bsts}の使い方を思い出しがてらついでに与太記事を書いてみます。お題は「データサイエンティスト」「人工知能」「AI(トピックス)」のGoogleトレンドから見る今後のブーム動向です。今回は互いに相互作用がないものとみなして、VARモデルではなく全て個々の時系列の単変量モデルでやります。



なお互いに相互作用があるケースを想定した分析については、1年半前のこちらの記事をご覧ください。ただし現在のデータで同じことをやったら違う結果になると思われます。




また{bsts}パッケージの使い方とその背景にある理論については僕が書いた以前の記事と、id:ill-identifiedさんの記事が分かりやすいかと思います。

続きを読む

ガウス過程回帰・分類をRで試してみた

先日こちらの書籍をご恵贈いただきました。

ガウス過程と機械学習 (機械学習プロフェッショナルシリーズ)

ガウス過程と機械学習 (機械学習プロフェッショナルシリーズ)

ガウス過程と機械学習ということで、本書の6.2節でも取り上げられていてハイパーパラメータ探索法として用いられることもあるベイズ最適化を僕は真っ先に思い出したのですが、以下の過去エントリを書いた際に「これって何でこうやってるんだろう」と思っていたことの大半が書かれていて、「なるほど」と納得すると同時に自分の勉強不足を恥じた次第です。。。「ガウス過程回帰法の特長をフル活用した応用技術」だったんですね。


ということで少しずつ読み進めているんですが、そう言えばRでガウス過程回帰出来るパッケージなかったっけ?と思っていたらありました。だいぶ老舗のパッケージでもある{kernlab}と、その他いくつかのCRAN / GitHub配布パッケージにガウス過程回帰・分類のメソッドが実装されているようです。そんなわけで、適当なサンプルデータを用意してサクッとガウス過程回帰・分類を試してみようと思います。ちなみにPythonの場合は普通にscikit-learnにgaussian_processがあるので、そこからimportすれば簡単に実践できます。こちらの方はググれば実践例が色々見つかりますので、今回は割愛します。


そしていつもながらですが、雑に勉強しながら適当に実践してみただけという記事ですので、誤りや理解不足のところなどあればガンガン突っ込んでいただけると有難いですm(_ _)m

続きを読む

Andrew Ngが説く「AIプロジェクトをいかにして始めるべきか」論

f:id:TJO:20190218130322p:plain
(Image by Pixabay)


大変に面白い記事がしばらく前のHBRに出ていて話題になっていました。筆者は、あのAndrew Ng。機械学習(ML)そして人工知能(AI)の研究者・教育者(Courseraの共同創設者)としてあまりにも有名ですが、Google BrainやBaiduのAI groupやLanding.aiを設立し率いた実務家としても著名です。


その彼が説く「AIプロジェクトをいかにして始めるべきか」論となれば、間違いなく一読の価値があることでしょう。ということで、今回のブログ記事ではそのHBR記事を取り上げることにしてみます。ただしHBRゆえいずれ翻訳記事が国内販売の日本語版で出ることが予想されるため、完全な翻訳を行うのはここでは見合わせます。以前の海外記事紹介の時と同様に、引用は見出しのみに留め、内容については要約とともに僕自身の経験に基づく補足を交えて論じることとします。


なお、原文を読むと分かりますがAndrew Ngは"pilot" projectについて論じています。つまりいきなり本番環境に行くのではなく、その手前の検証レベルでの話をしているという点に注意が必要です。

続きを読む