渋谷駅前で働くデータサイエンティストのブログ

元祖「六本木で働くデータサイエンティスト」です / 道玄坂→銀座→東京→六本木→渋谷駅前

データ分析職に採用されるために必要な「実務経験」をいかにして積むべきか

f:id:TJO:20170915112843p:plain
(Photo credit: https://pixabay.com/en/team-businessmen-competence-2651909/)


元々書いていたネタが間に合わない*1っぽいので、ふと色々な記事を眺めていて思い出したネタで与太記事を書きます(笑)。と言ってもこれは実は色々なところで色々な人から相談を受ける話なので、もしかしたらこの程度の記事でもどなたかの何かしらのお役に立つかもしれません。


データ分析職採用における「実務経験○年以上」という要件がもたらす「鶏と卵」問題


以下に引用するのは、とあるデータサイエンティスト求人案件に載っていた応募要件です。なおこちらの求人案件を選んだのはたまたま直近で受け取ったものだからというだけであり、特定の求人元に対して特定の意見を述べたいがためではない旨予めご承知おき下さい。

応募条件

  • 大学卒、大学院在学者、博士号取得者またはそれと同等以上の論理的思考力を有する方
  • 年齢:35歳くらいまで
  • 分析結果に対して論理的な考察を行い、他人に説明するともに今後のアクションプランを立案するスキル(コンサルタント経験あるいは理工系の論文・記事等の執筆経験
  • 統計解析、データマイニング機械学習などのいずれかの分野の専門知識、実務経験、研究実績
  • SQLを用いて数千万件規模の実績データを収集・集計するスキル、およびこれらを効率よく集計するためのデータ配置を設計するスキル(SQLを用いた実務経験3年以上
  • Python, Java, C++等でのアプリケーション開発経験(実務経験3年以上


あれば尚良い資質・条件

  • BIシステム・DWHシステム・その他実績分析系システムの企画・開発/導入・運用のいずれかの経験
  • マーケティングリサーチ、クォンツ等の業務経験、もしくは周辺システムの構築経験
  • Webサイト利用記録からの会員の行動分析および分析に基づいたリコメンド機能の開発経験Webサイト改善の経験

(※フォーマット等一部改変あり・赤字部筆者)

お読みいただいた通りで、あちこちに「○○の経験」という要件が並んでいます。それどころか「実務経験3年以上」という、年数を指定した要件も見られます。言い方を変えると、「今までにデータ分析職として働いた経験のない人は応募お断り」というようにも読める求人案件です。


これは結構厳しいように見えますが、個人的な観測範囲ではむしろこういう求人の方が圧倒的に多く、未経験者可というデータ分析職の求人なんて見たことがないと言った方が正解かもしれません。他のwebエンジニアやコンサルタント系の求人では時々未経験者可のものも見かけるのですが、データ分析職ではどこの企業も経験者を欲しがる傾向が強いように感じられます。それだけ属人的な要素がまだまだ強い職掌だということもあるのでしょうが、それにしても上記の例のように必須や望ましい要件に過去の実務経験が沢山並ぶと結構キツい気がします。


一方「おいおいそれはないのでは」と思うのが、機械学習エンジニアの求人なのに「実務経験5年以上」「webマーケティング領域での機械学習の実務経験必須」みたいなもの。機械学習エンジニアの本格的な活躍が始まったのって、それこそ2年ぐらい前からなのでは。。。そもそも日本でデータサイエンティスト含めてデータ分析職種が本格的に増えるようになってきたのはまさに5年ぐらい前からなので、実務経験5年以上というhiring barは幾ら何でも理不尽なのではと思うのですが。でもそういう求人も珍しくありません。


その意味で言うと「データ分析職に就くには実務経験が必要だが、実務経験を積むためにはデータ分析職に就かなければならない」という「鶏と卵」状態が発生することになりがちである、というのが現在の状況のようです。なお、見聞の範囲ではこれは日本に限らず、海外でも同じことが起きている模様です。


けれども、最近の人工知能ブームも相まってここのところデータ分析職を志して新たに参入しようと願う人々は改めて増えてきているようです。それでは、そういう人たちはどうすれば良いのでしょうか?


未経験者が実務経験(もしくはそれに近いもの)を積む方法


僕が知る限り、未経験者が「実務経験」もしくはそれにほぼイコールであるとアピールし得るものとして、最も手っ取り早いのは「Kaggleなどデータ分析(機械学習)コンペで上位入賞すること」です。

この手のデータ分析コンペが本当に実務経験とイコールだと看做しても良いのか?という点については色々な議論があるようですが、それでもこれらのコンペを通じて実際のデータ分析の現場でも行われていることを実践することが可能なのは事実だと思います。


例えばデータの前処理、特徴量エンジニアリング、実際のモデリング、モデルのチューニングとCVによるモデル選択、精度が上がらない場合のもう一工夫、と言ったデータ分析本体(の前工程と後工程を除いた分)のほぼ全てがKaggleを初めとしたコンペで実践し学ぶことができます。個人的には、Kaggleで上位入賞を果たしている応募者がデータ分析職に応募してきたら是非面接に呼んでみたいところです。


特に最近はKaggleが各種メディアを通じてすっかり有名になったこともあり、中には「KDD cup表彰メンバー在籍!」「現役Kaggle grand masterが在籍中!」とうたって人材募集する企業すら出てきています*2。実際の人材採用の場面においても、Kaggleなどのデータ分析コンペでの実績は重視される傾向になってきているように見受けられます。


ということで、実務経験がなくて困っているという方にはまずはKaggle以下データ分析コンペに参加してみて、そこで上位入賞できるようになるまで腕を磨いてみることをお薦めします。


ちなみに他に方法はないのか?というと。。。なくはないのですが、やはりこの5年間でデータ分析業界全体がそれなりに成熟してきたこともあり、なかなか難しいのかなと。かつてはある程度データ分析諸分野(統計学機械学習など)の素養はあるが全く無関係な職種の人をポテンシャル採用して、データ分析業務をやってもらいながら勉強してもらって徐々に分析職として力をつけてもらうというやり方もあったのですが、最近はそれを社内異動でやることはあっても新規中途採用でやることはほぼなくなったように思います。ただし、データ分析人材が採れなくて困っているスタートアップなどでは同様のやり方をやっているところもなくはないようです。


ちなみに数は限られますが、社内限定で特にエンジニアを対象として未経験者向けの統計学機械学習のトレーニングコースを設けて、積極的にデータ分析人材を増やす努力をしている企業も世の中にはあるようです*3。そういう企業を狙って移るというのも一手ですが、これはさすがにかなりの事情通でないと難しいかもしれません。。。それでもエンジニアでプログラミングが出来る人の方が、未経験者であってもデータ分析職に就ける可能性はあると思います。


経験者が実務経験のバリエーションを増やす方法


一方、データ分析業務の経験者が「それまでとは違う領域に進出したい」*4場合はどうしたら良いかというと、基本的には上記のケース同様他社のデータ分析職に新規中途採用で移るというのは容易ではないと思います。


その代わり、既に今現在自社内でデータ分析業務に就いているのであれば、一番確実なのは「社内異動でやってみたいデータ分析業務を手がけている別部署に移る」「自分の今現在の仕事にやってみたい種類のデータ分析業務を導入する」のいずれかでしょう。


ただし、どちらとも個々の企業次第で容易なこともあれば難しいこともあるという印象があります。個人的な観測範囲かつほぼ主観的な印象で言うと、ベンチャー系など比較的会社の歴史が短いところほど社内異動は容易で、老舗の大企業など比較的会社の歴史が長いところほど難しいようです。また、エンジニアロールからビジネスロールに移るのはOKでも、その逆はNGというところが多いと聞きます*5


いずれにせよ「出来る限りローリスクな環境で新たなデータ分析の実務経験のバリエーションを増やす」というのが、データ分析業務経験者が仕事の幅を広げていく上で重要なことなのではないかと思います。


新卒採用では事情が異なるらしい


f:id:TJO:20160705224754j:plain

ここまで書いたのは中途採用の話でした。では新卒採用はどうかというと、そもそも中途採用とカルチャーが違うということを反映してやはりデータ分析職採用についても事情が異なるようです。


個人的にもデータ分析関連の新卒採用活動を担当したことがありますが、やはり新卒採用自体が全般的にポテンシャル採用であることもあり、基本的には「データ分析業務に関連する学部・学科・専攻出身の学生さんであること」が第一義的に重視されるように感じています。今時だと、理工系学部のCS系学科・専攻出身者がよく注目されるという按配ですね。この場合は卒論・修論(そして博論)での研究テーマも見られるケースが多いように見受けられます。NIPSやKDDなど有名国際カンファレンスでの発表実績などもあると、文字通り争奪戦になるケースすらあります。


とは言え、事実上CS系専攻の学生さんだけがターゲットになっていることもあり、全般的に見て中途採用における「経験者vs.未経験者」の構図が「CS系就活生vs.その他の就活生」という構図に置き換わっているだけという印象が拭えません。そのせいもあり、例えば経済学部で計量経済学を学んでいて統計学機械学習などの分野に詳しい学生さんが就活に臨んでも、データ分析が出来ると看做されずに選考から漏れてしまうというケースは少なくないようです。この辺は採用活動をする各企業の側も「良い学生が見つからない」とか嘆いていないで、もうちょっと調べておくべきだと思うのですが。。。


ということで、僕がCS系以外の専攻の就活生の人たちからデータ分析職に(新卒就活で)就きたいという相談を受けた場合は、実は「Kaggleなどのコンペで頑張って入賞して実績を作って下さい」とアドバイスするようにしています。


海外の事情


ところで、日本を除く海外では事情が大きく異なるようです。例えばよりハイレベルな仕事に就くために今の職を辞めてMBAに通うというやり方が当たり前の世界なので、データ分析職に関しても「データ分析系諸分野の専門職大学院や大学のトレーニングプログラムに通ってスキルを身に付けて、その後に職を探して採用される」というルートが割と一般的なようです。


以前も紹介したことのあるものとしては、"Insight Data Science Fellowship Program"が挙げられます。これは5年前の僕のような、他分野でポスドクとして研究経験を積んできていてサイエンスする能力は持っているものの、産業界でデータ分析職として働くには様々な実務面・技術面でのトレーニングが必要だという人々のために、短期間でそれらのトレーニングを詰め込むというプログラムです。


他にも、世界各地の有名大学の中にはデータ分析職の育成を主目的とするビジネススクールを開設しているところも出てきており、聞き及ぶ範囲ではMIT Sloan Master of Business Analytics ProgramNYU MSc Business AnalyticsNUS MSc Business Analytics Programmeなどがあります。日本国内での事情は寡聞にして分かりませんが、少なくともUSやシンガポールではこれらのスクールの卒業生はデータ分析人材としてのスキルと経験を備えていると看做され、様々なグローバル企業も卒業生を積極的に採用しているらしいと伝え聞きます。


そのような事情もあり、これらのスクールで統計学機械学習などの諸分野及びプログラミングやデータ基盤技術などを学んでから、データ分析で有名な企業に就職するというキャリアパスが確立しつつあるようです。日本からもこのキャリアパスを辿ってデータ分析職に就いた(就こうとしている)方もいらっしゃるようで、いずれは日本国内でもそのような専門職スクールが増えることを期待したいところです。


終わりに


ということで結論だけ書くと「Kaggleやれ」「無理にでも社内異動しろ」「海外の専門職スクールに行け」しか言っていない感じがして、大して有意義な記事になっていない気もしますが(汗)、お後がよろしいようで。。。

*1:自分の中で設定しているdeadlineに

*2:ググるとすぐ分かってしまいますがあえて社名は伏せておきます笑

*3:どことはあえて明言しないでおきます

*4:統計分析コンサル→機械学習エンジニアもしくはその逆など

*5:故に「統計分析コンサル→機械学習エンジニア」は元の部門がビジネス側だと難しいが、もちろん中には例外もある