六本木で働くデータサイエンティストのブログ

元祖「銀座で働くデータサイエンティスト」です / 道玄坂→銀座→東京→六本木

スーパーマン、三位一体、それとも?:データサイエンティストの定義を考える

Data Scientist: The Sexiest Job of the 21st Century - HBR

 

「データサイエンティスト」という言葉が、世に広まるきっかけになったハーバード・ビジネス・レビューの有名な記事です。日本語版も出版されているので、お読みになった方も多いでしょう。

 

僕なんぞがここで四の五の言わなくても、「データサイエンティストの定義」についてはこれまで様々なメディアで様々な人々が語り尽くしてきています。はっきり言って、世間でのコンセンサスを知るにはそれらのメディア記事を読んでもらった方が早いと思います。笑

 

ところで、そのコンセンサスの取れている(取れつつある)データサイエンティストの構成要件というのは、恐らく以下の3つの能力だと思います。

1つ目は言うまでもないですね。要は統計学機械学習などの、ずばり「サイエンス」の部分を扱う能力です。2つ目は(例えば)Excelやその他BIツールなどを用いて、データの「意味」を可視化したりナレッジとして創出する能力です。そして3つ目は、それらのナレッジに基づいて実際の経営課題に対して、改善提案や新規戦略提案などを行い、ビジネス面での意思決定に寄与する能力です。

 

 

なるほど、確かにこれだけ揃っていればデータサイエンティスト、と名乗っても良さそうですね。The sexiest job in the 21th centuryとうたわれるのも納得です。

 

・・・でも、ちょっと待ってください。この3つ、全部兼ね備えている人ってどれくらいいますか?それはいくら何でもかなりの無理ゲーじゃないですか?HBRの記事だってこう言ってますし。

 

What kind of person does all this? What abilities make a data scientist successful? Think of him or her as a hybrid of data hacker, analyst, communicator, and trusted adviser. The combination is extremely powerful—and rare.

 

そう、そんな人そうそうはいないんですよ。だって、それはスーパーマンそのものじゃないですか。

 

という、ないものねだりのような現状に対して、ブレインパッドの佐藤洋行さんはこんなことを仰っています*1

 

「組織としてのデータサイエンティスト」

 

即ち、一人の人格の中に共存させるのが難しいデータサイエンティストの各能力について、それぞれに秀でた人材が集まることで、「組織として『完全なデータサイエンティスト』になる」ことができるのではないか?ということです。

 

僕はこれを「データサイエンティスト三位一体説」と呼んでいます。異なる3タイプのデータサイエンティストが集まることで、完全なデータサイエンティストとして機能する、という捉え方です。今後データサイエンティストを必要とする企業や組織は、その点を踏まえて人事戦略を練るべきなんだと考えています。

 

------------

 

ところで、最近いくつかの記事で「日本にはデータサイエンティストは40人ぐらいしかいない」という主張を見かけます。なるほど、確かにそうかもしれません。でも、僕の知る限り上記の3種類の能力のそれぞれを満たす人材は、日本にはもっと沢山いると思うんですね。

 

では、どうしたら「40人ぐらい」というえらく少ない数字になってしまうんでしょう?・・・これは僕の考えですが、

 

「実際のビジネスにコミットしていて初めて『データサイエンティスト』と呼ばれる」

 

ということなんじゃないでしょうか。当たり前のような話に聞こえますが、これは物凄く大事なことです。というのも、実は(例えば)FacebookはLinkedInなどでは

  1. Data Scientist
  2. Quantitative Researcher
  3. Quantitative Engineer

を完全に分けて募集しているんですね。少なくともFacebookはこの3つを別物として認識しているということだと思います*2

 

これを踏まえて改めて書き直すと、

  • 実際のビジネスにコミットしている:Data Scientist
  • 実際のビジネスにコミットしていないが研究開発を行っている:Quantitative Researcher

ということになるのではないでしょうか。これなら、確かに日本だと前者は40人ぐらいしか多分いない*3でしょうし、逆に後者はかなりの数がいるものと思われます。

 

となると、ある意味日本のデータサイエンス業界における急務の一つは、「実際のビジネスにコミットする人材」をとにかく増やすことになるんでしょうかね。そこにもコミットするということが、もしかしたら日本のデータサイエンティストにとっては大事な仕事なのかもしれません。

*1:slideshare: 「データサイエンティストとは?そのスキル / ナレッジレベル定義の必要性

*2:※Quantitative Researcher / Engineerという語は日本では馴染みのない方が多いと思いますが、例えばWikipedia定量的研究 / Quantitative Researchの記事をご覧頂ければ分かりやすいでしょう

*3:実は世間的にビッグデータを扱っていそうだと思われる名の通った大企業でもデータサイエンスによる経営改善にまだ着手していないところだらけです