渋谷駅前で働くデータサイエンティストのブログ

元祖「六本木で働くデータサイエンティスト」です / 道玄坂→銀座→東京→六本木→渋谷駅前

Andrew Ngが説く「AIプロジェクトをいかにして始めるべきか」論

f:id:TJO:20190218130322p:plain
(Image by Pixabay)


大変に面白い記事がしばらく前のHBRに出ていて話題になっていました。筆者は、あのAndrew Ng。機械学習(ML)そして人工知能(AI)の研究者・教育者(Courseraの共同創設者)としてあまりにも有名ですが、Google BrainやBaiduのAI groupやLanding.aiを設立し率いた実務家としても著名です。


その彼が説く「AIプロジェクトをいかにして始めるべきか」論となれば、間違いなく一読の価値があることでしょう。ということで、今回のブログ記事ではそのHBR記事を取り上げることにしてみます。ただしHBRゆえいずれ翻訳記事が国内販売の日本語版で出ることが予想されるため、完全な翻訳を行うのはここでは見合わせます。以前の海外記事紹介の時と同様に、引用は見出しのみに留め、内容については要約とともに僕自身の経験に基づく補足を交えて論じることとします。


なお、原文を読むと分かりますがAndrew Ngは"pilot" projectについて論じています。つまりいきなり本番環境に行くのではなく、その手前の検証レベルでの話をしているという点に注意が必要です。

続きを読む

2019年版:データサイエンティスト・機械学習エンジニアのスキル要件、そして期待されるバックグラウンドについて

f:id:TJO:20190217170338p:plain
(Image by Pixabay)

この記事は、以前の同様のスキル要件記事のアップデートです。

正直言って内容的には大差ないと思いますが、今回は2つ新たな軸を加えることにしました。一つは「ジュニアレベル(駆け出し)」と「シニアレベル(熟練職人)」とで分けるということ、もう一つは「データ分析以外の業界知識(ドメイン知識)」にも重きを置く、ということです。


というのも、空前の人工知能ブームが予想よりも長く続いていることで、人材マーケットを観察する限りではデータサイエンティスト・機械学習エンジニアとも求人数が高止まりしているように見えるのですが、その結果としてこのブログの過去のスキル要件記事で挙げたような「完成されたデータ分析人材(熟練職人)」に限らず「駆け出し」でも良いからデータ分析人材が欲しいという企業が増えているように感じられるからです。


その一方で、かつては主にwebマーケティング業界に集中していたデータ分析専門職が、今や非常に幅広い相異なる業界に多岐に渡って分布しており、むしろバックグラウンドとなる業界ドメイン知識についても細分化していくこと、そしてそれによるアドバンテージも考慮する必要が出てきているようにも思います。今回の記事ではその点についても少し触れています。


いつもながらの断り書きですが、言うまでもなくここに並べた内容はあくまでも僕の個人的な意見にして、なおかつ僕自身がこれまでの経験と見聞に基づいて「これまで自分が属してきた組織やチームにおけるデータサイエンティストや機械学習エンジニアがこうであったら良かったかも」という最大公約数的な願望を書き並べたものに過ぎません。よって何かの組織や団体の意見を代表するものではありませんし、況してやauthorizeされた意見として見られるべきものでもないという点、予めご了承くださいm(_ _)m 願わくば、前回記事でリンクした榊さんの記事のように「うちの組織ではこういう考え方をしている」というようなご意見(ご異見)をお寄せいただけると有難いです。


また、機械学習エンジニアのスキル要件については僕自身が現在エンジニア部門に所属していないこともあり、チェックも兼ねて友人知人で実際に機械学習エンジニアとして働いている人たちにレビューしてもらっており、実際スキル要件の内容にもレビューコメントを反映させています。ただし、それでもその人たちの経験と見聞の範囲に留まるという点にご留意ください。

続きを読む

生TensorFlow七転八倒記(10):テキストデータをTF-Hubでfeature vectorに直してからt-SNEにかけてみる

今回もただの備忘録ですが、どちらかというと番外編です。TensorFlow部分はあくまでもTF-Hubでテキストデータをfeature vectorに直すところまでのみで、そこから先は今まであまり試してこなかったt-SNE (t-distributed stochastic neighbor embedding)を使っています。


参考にした記事は以下の3点です。



ということで、だらだら書いていきます。いつもながらですが、今回の記事もいい加減な理解に基づいて適当なまとめを書いているようなものですので、間違っている点や理解不足に見える点がありましたらどしどしご指摘くださいm(_ _)m

続きを読む