渋谷駅前で働くデータサイエンティストのブログ

元祖「六本木で働くデータサイエンティスト」です / 道玄坂→銀座→東京→六本木→渋谷駅前

Facebookが考えるデータサイエンス「研究者」の要件


前の記事ではFacebookが考えるデータサイエンティストの要件、について書いたわけですが。


実は、Facebookはデータサイエンティストとは別に「データサイエンスの研究者」も募集しています。その職種名を"Quantitative Researcher"と言います。直訳すれば「定量的研究の研究者」、言い換えればデータサイエンスの「研究者」です*1



このポジションはさすがに「研究者」だけあって、生半可なスキルセットでは応募できない印象です。

Responsibilities

  • Grow Facebook's data assets: expand infrastructure used to collect direct user feedback (attitudinal data), and to measure desktop/mobile/tablet user activity (behavioral data).
  • Chart the analytic course: help identify areas where our data assets can be used to further the cause of Facebook Growth and Engagement. Develop metrics, models, and analytical frameworks that can scale across the org and help product & business owners make better decisions using data.
  • Solve problems: Use historical data (and on occasion run experiments and surveys to collect more of what you need) to infer causal relationships, extract signal from noise, explain signal, explain noise, predict signal, predict noise, and generally establish rigorous, quantitative understanding of user behavior to support--and define--the highest priority, highest-leverage efforts for the team.


職務について

  • Facebookのデータ資産を育てる:直接のユーザーからのフィードバックを集めるインフラを拡張する、ユーザーのPC / スマートフォン / タブレット上における行動データを測定する、など
  • データ分析の枠組みを計画する:Facebookの成長と社会への関与を広げるために、我々のデータ資産をどの領域に対して用いるべきかを突き止める
  • 問題解決にコミットする:履歴データ(時には自ら実験するor必要に応じて取得方法を模索する)を用いて、ユーザー行動の・・・
    • 因果関係を推定し
    • ノイズからシグナルを抽出し
    • そのシグナルが何か&そのノイズが何かを説明し
    • そのシグナル&ノイズを予測し

ともあれ正確で定量的な理解を得て、Facebookというチームが何を最優先にして取り組むべきかを定義する

Requirements

  • M.S. or Ph.D in a quantitative field (such as statistics, computer science, mathematics, engineering, machine learning, etc.) or 4+ years of relevant experience
  • Fluency in the languages of data manipulation and analysis: R/SAS/Matlab, unix, scripting
  • Interest and experience in applied (vs. theoretical) quantitative research
  • Ability to ask, as well as answer, meaningful & impactful questions
  • Ability to communicate complex analysis and results to any audience
  • Experience with very large datasets (> 1TB) a plus


要件

  • 定量的研究分野統計学・コンピューターサイエンス・数学・工学・機械学習など)における修士号もしくは博士号、ないし当該分野での4年以上の職務経験
  • R / SAS / Matlab, UNIX, スクリプト言語を用いたデータ操作と分析に習熟していること
  • 応用的な(理論的ではない)定量的研究への関心と経験
  • 有意義でインパクトのある問題を、解決するのみならず提案できる能力
  • 複雑なデータ分析とその結果をいかなる相手にも伝えられるコミュニケーション能力
  • 1TB以上の巨大データセットを扱った経験

ぶっちゃけ、アカデミアの研究者から見ればそんなに凄い話ではないと思いますが*2、裏を返せば何かしらの理系分野でのPh.D.がないと応募すること自体がキツい要件だとも言えるでしょう。


それは、Facebookが「未来のFacebookのために基礎研究体制を構築しようという強い意思がある」ことの表れである、ということかと。


もう少し踏み込んで言えば、「データサイエンスの未来を切り開くにはこれぐらいの能力の持ち主であるべきだ」というFacebookからのメッセージであり、産学問わずデータサイエンスの未来にコミットしたいと思ったら、これぐらいのスキルセットを揃えてくる覚悟が必要だ、ということではないでしょうか。


ということで、僕はこのスキルセットも満たせるように今後とも精進していこうと思います。もっとも、それはFacebookに行きたいということを必ずしも意味しませんが。笑

*1:ちなみに現在はopenではないものの"Quantitative Engineer"という職種の募集もFacebookは以前やっていた。こちらは要するに「データサイエンスの学識を有するシステム開発者」で、実は僕はこのポジションについてFacebook本社のリクルーターから直接勧誘されたことがある(笑)。途中で話が立ち消えになったけど・・・

*2:要するに定量的研究の方法論そのままを言っているので、少しでも定量的研究分野での基礎研究の経験があればむしろ手慣れた話で難しくも何ともない