渋谷駅前で働くデータサイエンティストのブログ

元祖「六本木で働くデータサイエンティスト」です / 道玄坂→銀座→東京→六本木→渋谷駅前

データサイエンティストや機械学習エンジニアに求められる「素質」とは何か

f:id:TJO:20180822221813p:plain
(Image by Pixabay)

某所で時々意見交換させていただいている@さんが、面白い記事をnoteにupなさっていたので拝読しました。細かい内容は上記のリンク先から皆さんに直接お読みいただくとして、記事中で某所で僕が放言(笑)したことへのご質問をいただいていたのでした。それは、データサイエンティストや機械学習エンジニアといったデータ分析人材に求められる「素質」について、です。

それは例えば統計学機械学習はたまたプログラミングといった「スキル」や「素養」とも違う、言ってみれば性格的傾向とか仕事スタイルとかはたまた思想信条のような、もうちょっと属人的で曖昧なものだと思うのですが、個人的な経験からはその「素質」の有無がデータ分析職として育成した結果、ものになるかならないかを分けるように感じられています。


ということで、あくまでも個人的経験に基づく範囲でデータサイエンティストや機械学習エンジニアをゼロから育成する際に、事前に求められる「素質」とは何かという点について簡単に論じてみようと思います。はい、今回も与太記事です(笑)。業界事情ネタなので、情報源の秘匿も含めてデータは基本的には開示できませんというか、そもそも定量的データとしてまとまることのない性質のお話ですので、その点はご容赦を。なお、いつものdisclaimerで恐縮ですが、ここで論じられている内容はいかなる組織や機関のいかなる実例とも一切関係ありませんので、どうか悪しからずご了承ください。

  • 「素質」は大別すると3種類ある
    • データドリブンなメンタリティ
    • データ分析を支える学術・技術への学習意欲
    • 旺盛かつ根源的な知的好奇心
  • 身も蓋もないまとめ
続きを読む

日本の人工知能バブル、いよいよ弾けるか?

f:id:TJO:20180813143519p:plain
このブログでは定番のマーケットトレンド調査ですが、今回は若干雲行きの怪しさを感じさせる結果が得られたので取り急ぎシェアしておきます。ちなみに言うまでもなくこの調査は僕自身の個人的なものであり、この記事で述べられている見解はいかなり組織にも関係はなくまたいかなる組織をも代表しないものであることを予めお断りしておきます。

続きを読む

機械学習プロジェクトが失敗する9つの理由

f:id:TJO:20180802205223p:plain
(Image by Pixabay)

勉強が進まないので、今回は与太記事でも書いてお茶を濁すことにします(笑)。ネタはこちらです。

読んで字の如し、「あなたの機械学習プロジェクトが失敗する9つの理由」というグサグサ刺してくる論評記事です。あまりにもオリジナルの記事が素晴らしかったということか、KDnuggetsに誘われてrepostされた模様です*1


最近は機械学習の学術・技術的研究開発も極めに極まったところで一息つく感じになってきている印象で、どちらかというとインダストリーサイドではML Opsという考え方が提唱されるようになってきています。その内容については我らがid:rindai87さんのブログ記事が分かりやすいかなと。

ML Opsという名前で皆さんが期待している、課題に思っている内容は以下4つっぽい印象でした。

  1. そもそもシステムやサービスのどこにどのように機械学習を利用しているのかの話
  2. 機械学習のコードのテスト、モデルのデプロイ、モデルとデータの監視、自動化、などのいわゆるシステム運用の機械学習版っぽい話
  3. 機械学習のコード、あるいはシステム全体の高速化(GPUなどのハードウェア的な話や分散処理を含む)の話
  4. 機械学習システムの開発/運用体制の話

ということで、Dev Opsと呼ばれている話の機械学習版+活用パターンというのがニーズなのかな、とぼんやり考えています

こういうOps系の話が出てくると必然的に出てきがちなのがいわゆる「アンチパターン」リストなんですが、意外とその辺って周囲のMLerたちと話した限りでは暗黙知的な要素が濃いんですよね*2


とは言え、まともにきちんとしたアンチパターン集とかバッドノウハウ集とかそれこそ"Bad Machine Learning"みたいなものを編もうとしたら大変な手間になるので、今回はそこまで本格的なことはやらずに*3たまたまKDnuggetsで見つけた上記の記事の抄訳紹介をしてみようと思います。改めて、題して「機械学習プロジェクトが失敗する9つの理由」です。なお、そのまま抄訳だけ書いても素っ気ないので適宜僕自身のコメントも加えてあります。

*1:実は僕も英語ブログの記事の一つがGregory先生からの要請がありrepostされてます

*2:某くんと話した時も産学双方のアンチパターンのリストが出てきたものの、こういうのってシェアされないよねという話題になった

*3:これはこれで非常に大事なテーマなのでそのうち腰を落ち着けてやりたいと思ってます

続きを読む