最近になって、前よりもさらに多くの方々から「データサイエンティストになりたいと思ってるんだけどどうしたらいいか」と相談されることが増えてきました。まぁ、これだけ新しいキャリアとして喧伝されていれば当然かと。。。
で、新卒ならどうしたら良いか?という話は既にしました。さすがに新卒だとデータサイエンティストを志望する人であってもそこまでスキルを持っていないのが普通*1なので、「少しでも経験を積みやすい企業に入りましょー」としか言いようがないんです実際。
しかしながら、新卒に比べて圧倒的に多いのは「今○○やっててこれからデータサイエンティストに転じたいんだけど。。。」という相談なんですよね。つまり中途というか、既に○○のキャリアの途中まで来たところでデータサイエンティストに転じよう、という。
ぶっちゃけ「データサイエンティストになれる人はなれるし、なれない人はなれない」以上のことは言いようがないんですが、それでも僕が個人的に見聞したケースを踏まえて、こんな感じだったらいいんじゃないかな?というポイントをまとまりなく書いてみようと思います。
あ、いつもながらですが定量的根拠はゼロです。そしてポジショントークかもしれませんので、話半分に読んでもらった方が良いと思います(笑)。
現在の職種という要件
だいぶ前の記事でも書きましたが、さすがにバックグラウンドがかけ離れ過ぎているとめっちゃツラいと思います。。。「情熱と根性だけはあります!」って言う人も時々いますが、情熱と根性で主観バリバリ入りまくりでデータ分析されても困るので(笑)。
一応、僕個人が勝手に「データサイエンティストに転じやすい」順に職種を並べてみました。僕が出会ったことのある人たちの職種しか書いてないのはご容赦。あと、クオンツとかアクチュアリーとかデータサイエンティストみたいな職種の人たちは完成形とみなして外してあります。
DBエンジニアorインフラエンジニア
DBを叩ける&データの眺め方を知っている、という点で重要。だいぶ前の記事にも書きましたが、SQLが出来るというのは現在のデータサイエンティストのあり方を見るにもはや大前提と言っても良いと思います。なお、その延長上でインフラエンジニアも適していると思ってます。色々な意味でデータを常時見ている*2人が多いからです。
サーバーサイドエンジニア
データ分析に頻出のプログラミング言語に通じている人が多く、実際にサーバーサイド実装からデータ分析の道に進んだという例をよく聞きます。特にPython, Ruby, Java, C++ができれば言うことなし。データマイニング実装エンジニアなら完璧なんですが、それは既にデータサイエンティストと同じかも(笑)。
コンサルタント
そもそもコンサルの人たちは「数字を見てロジカルに考える」のが仕事(だと思う)なので、データサイエンティストに転じるのは容易でしょう。。。と思ったんですが、そうでもないという意見が結構ある*3みたいですね。とは言え、アドホック分析系に限ればむしろ最有望と言っても良いかと。ただし、データを見て仕事してないコンサルは無理だと思います。残念ながら。
やるべきこと
もちろん、何かしら努力しないとデータサイエンティストにはなれません。いや勝手に名乗ってもいいんですが、多分「データサイエンティスト()」って言われますよー*4。
まずデータ分析に取り組んでいる部署に頑張って異動する
そもそも実際のビジネスの現場のデータ分析経験を積んでいなければ、データサイエンティストと名乗るのはやっぱり難しいです*5。
ということで、今の職場で頑張って手を挙げて、データ分析に取り組んでいる部署に異動しましょう。データ分析を必要としている部署なら、大体どこでも良いと思います。ネット系企業なら迷わずデータ分析専業部門に、代理店とか商社ならマーケティング部門など、メーカーでも品質管理部門がデータ分析を実践していたりします。
ちなみに、NTTぷららの事例のようにゼロからデータ分析部門を立ち上げてしまうというやり方もあります。このケースでは情シス部門が主体となってチームビルドしていますね。
頑張ってデータ分析の経験を積む
初めのうちはどの部門に異動したとしても初心者扱いされると思うので、まずは降ってきたデータ分析そのものの業務or関連する業務をゴリゴリこなしていくことが大事かと。
最初のうちは糞ゴミ煩雑なCSVファイルの仕分け&データ成型みたいな下仕事が多いかもしれませんが、そのうち主要なレポートの集計作業とか、もっと進めばガチの予測モデル作成みたいな仕事が降ってくるようになると思います。
実務をこなしながら独学でスキルも身に付ける
とは言え、降ってくる業務をこなしているだけではその現場の「ノウハウ」がたまるだけで、「スキル」は身に付きません。同じことはITエンジニアにも言えますが、仕事をする以外にも自らインプットしていく必要があると思います。
で、何を勉強したら良いか?ということですが。初心者向け文献リスト、中級者向け文献リストの記事もありますが、もう面倒臭いのでこの本で勉強しましょう。
データサイエンティスト養成読本 [ビッグデータ時代のビジネスを支えるデータ分析力が身につく! ] (Software Design plus)
- 作者: 佐藤洋行,原田博植,下田倫大,大成弘子,奥野晃裕,中川帝人,橋本武彦,里洋平,和田計也,早川敦士,倉橋一成
- 出版社/メーカー: 技術評論社
- 発売日: 2013/08/08
- メディア: 大型本
- この商品を含むブログ (8件) を見る
内容については前の記事でも激賞した通りで、折り紙つきです。少なくとも、実際にデータ分析している部署で仕事をするようになっていれば、この本を読みこなすのは難しくないはずですよー。
気を付けるべきこと
晴れてデータサイエンティストになりました!からと言って、何もかも良いことばかりではありませんというか、バラ色の将来というほど世の中甘くないです。
データサイエンティスト・ブームは長くは続かない
ちょっと前の記事にも書きましたが、多分データサイエンティストの採用ブームはあと2年ぐらいで終わります。そこから先は普通のエンジニアと同程度か、それよりも低強度での採用が続くといった感じでしょう。
そしてデータ分析そのもののブームの過熱も、5年ぐらいで一段落することでしょう。その後はデータ分析を継続して強化していく企業と、ブームから醒めてデータ分析に力を入れなくなる企業とに分かれていくのではないかと思います。そうなった時に、どうやって自分のキャリアを組み立てていくか?についても今から真剣に考えておくべきだというのが僕個人の意見です。
データサイエンティストの仕事はそんなに格好良くない
何度か僕もTwitterで呟きましたし、僕なんぞヘッポコに限らず各社のものすごーーーく優秀なデータ分析者の皆さんも叫んでますが、「データサイエンティストの仕事の9割は前処理(フォーマッティングやデータクレンジングなど)」です。糞ゴミ煩雑なCSVファイルをさばくのに工数の9割を潰すなんて当たり前、DMPとか導入すればその保守も仕事になったりします*8。
色々なデータサイエンスの本に出てくるような格好良くて華麗なデータ分析の出番なんて、うっかりすると日常業務の1割未満。そういう中にあっても、遺憾なく実力を発揮できるのが本物のデータサイエンティストというものなのだと勝手に思ってます。
*1:ごくごく少数のエキスパートもいますが、在学中に起業したり本まで書いちゃうようなレベルだったりするのでそれは例外
*2:各種インフラまわり数値の監視とか
*3:文系出身者が多くて統計学や機械学習が出てくると辛いみたいな話
*4:肝心の僕が言われてる気がするというのは秘密
*5:大学などのアカデミックな研究者がデータサイエンティストと呼ばれない所以でもあります
*6:僕の場合は前職で技術委員会に加わった時にCTOから「君のロールはデータサイエンティストだよね」と言われて以来だったりします
*7:それは僕がたどった道ですがな
*8:僕も分析スクリプトを本番環境にコミットしてビルドしたり、ログ収集をcrontabでスケジューリングとかしてました