渋谷駅前で働くデータサイエンティストのブログ

元祖「六本木で働くデータサイエンティスト」です / 道玄坂→銀座→東京→六本木→渋谷駅前

2019年版:データサイエンティスト・機械学習エンジニアのスキル要件、そして期待されるバックグラウンドについて

f:id:TJO:20190217170338p:plain
(Image by Pixabay)

この記事は、以前の同様のスキル要件記事のアップデートです。

正直言って内容的には大差ないと思いますが、今回は2つ新たな軸を加えることにしました。一つは「ジュニアレベル(駆け出し)」と「シニアレベル(熟練職人)」とで分けるということ、もう一つは「データ分析以外の業界知識(ドメイン知識)」にも重きを置く、ということです。


というのも、空前の人工知能ブームが予想よりも長く続いていることで、人材マーケットを観察する限りではデータサイエンティスト・機械学習エンジニアとも求人数が高止まりしているように見えるのですが、その結果としてこのブログの過去のスキル要件記事で挙げたような「完成されたデータ分析人材(熟練職人)」に限らず「駆け出し」でも良いからデータ分析人材が欲しいという企業が増えているように感じられるからです。


その一方で、かつては主にwebマーケティング業界に集中していたデータ分析専門職が、今や非常に幅広い相異なる業界に多岐に渡って分布しており、むしろバックグラウンドとなる業界ドメイン知識についても細分化していくこと、そしてそれによるアドバンテージも考慮する必要が出てきているようにも思います。今回の記事ではその点についても少し触れています。


いつもながらの断り書きですが、言うまでもなくここに並べた内容はあくまでも僕の個人的な意見にして、なおかつ僕自身がこれまでの経験と見聞に基づいて「これまで自分が属してきた組織やチームにおけるデータサイエンティストや機械学習エンジニアがこうであったら良かったかも」という最大公約数的な願望を書き並べたものに過ぎません。よって何かの組織や団体の意見を代表するものではありませんし、況してやauthorizeされた意見として見られるべきものでもないという点、予めご了承くださいm(_ _)m 願わくば、前回記事でリンクした榊さんの記事のように「うちの組織ではこういう考え方をしている」というようなご意見(ご異見)をお寄せいただけると有難いです。


また、機械学習エンジニアのスキル要件については僕自身が現在エンジニア部門に所属していないこともあり、チェックも兼ねて友人知人で実際に機械学習エンジニアとして働いている人たちにレビューしてもらっており、実際スキル要件の内容にもレビューコメントを反映させています。ただし、それでもその人たちの経験と見聞の範囲に留まるという点にご留意ください。

続きを読む

生TensorFlow七転八倒記(10):テキストデータをTF-Hubでfeature vectorに直してからt-SNEにかけてみる

今回もただの備忘録ですが、どちらかというと番外編です。TensorFlow部分はあくまでもTF-Hubでテキストデータをfeature vectorに直すところまでのみで、そこから先は今まであまり試してこなかったt-SNE (t-distributed stochastic neighbor embedding)を使っています。


参考にした記事は以下の3点です。



ということで、だらだら書いていきます。いつもながらですが、今回の記事もいい加減な理解に基づいて適当なまとめを書いているようなものですので、間違っている点や理解不足に見える点がありましたらどしどしご指摘くださいm(_ _)m

続きを読む

研究者を辞めた時のこと、そしてその後のこと


TL;DR これは、このブログの本題とは何の関係もない僕自身の回顧録にして懺悔録であり、見ようによっては怪文書です*1。故に、記事中には何の参考になる内容も書かれていないことを予めお断りしておきます。それでも良いという方だけ、この先をお読みください。ただしTL;DRと書いた通りで、超長文につきご注意を。


当時から7年が経ち、この中に登場する人物の中には既にリタイアしている人もいれば、物故している人もいます。ある意味もう時効だろうということで、その時起きたことをつぶさに書いてみることにした次第です。

*1:一応親友にして悪友の弁護士に事前に内容を見せて相談したところ関連法規と照らし合わせて「問題なし」とのコメントをもらっています

続きを読む