渋谷駅前で働くデータサイエンティストのブログ

元祖「六本木で働くデータサイエンティスト」です / 道玄坂→銀座→東京→六本木→渋谷駅前

2013年の「データサイエンティスト」狂想曲と個人的なあれこれとを振り返る

早いもので、2013年も過ぎようとしているこの年末ですが。一応ブログのタイトルに「データサイエンティスト」と入っているので(笑)、せっかくなのでこの1年間のデータサイエンティストにまつわる狂想曲と、僕自身の今年のヒストリーとを簡単に振り返ってみようと思います。


とりあえず、ざっとトレンドを掴むためにGoogleトレンド「データサイエンティスト」の結果を載せておきます。

f:id:TJO:20131219230651p:plain:w277

もう見るからに、全力でバズってから一気に下降線をたどってるのがよく分かりますねー。ここまであからさまだと実に清々しいです。


それは、HBR日本版2月号の「データサイエンティスト」特集から始まった


以前の記事でHBR本家版に載っていたDavenportの論説について取り上げましたが、それが日本語版になったのが2月号だったようです。確か12月か1月ぐらいに刊行されていたような記憶が。


データサイエンティスト・ブームが始まったのは、個人的にはこれくらいからだと思うんですよね。少なくとも、前職にいた昨年秋ごろにはまだそういう流れは感じなかったので(データ分析の重要性自体は徐々に語られ始めていたけれど)。


この頃は前職の時の現場でも「データサイエンティストとは何者なのか」についての認識は物凄くあいまいで、「Hadoop上でそらでJavaでMapReduceできなきゃ名乗る資格ないよね」とか僕がdisられることもよくありました。ええ、今もできませんが何か?(滝汗)


3~6月ぐらいは「みんな興味があるけど何者なのか誰も知らない」期だった


この頃から徐々にweb上でもデータサイエンティストについての話題が持ち上がるようになったんですが、それこそ「みんな興味あるんだけどそもそもデータサイエンティストって何なのよ?」状態だった記憶があります。そう言えば、これくらいの時期にこのブログも始めたのでした。


で、ちょうどこの時期に前職で開いた勉強会で話した内容をslideshareにupしたら、そこそこ人気が出たのを覚えてます。


そのはてなブックマーク


ちょうどこういう情報が求められていたというか、データサイエンティスト・ブームの当事者からの情報発信が特にIT業界の人たちから求められてるなーという感があったので、うまくそれにはまったということなのかもですね。


個人的には、この頃はちょうど転職を決断した時期でもあります。その顛末は退職エントリに大体書いた通りです。今だから言えますが、この時期から初秋にかけてはものすごーーーくデータサイエンティストの募集が多かったですね。同時期に転職した人のサラリーが僕よりさらに凄かった件*1とか、色々ありましたなぁ。。。


7月にデータサイエンティスト協会が発足してバズり始めた


実は僕はこの計画については1月末ぐらいから聞いていたんですが、協会発足の正式な日程を聞いたのは割と直前になってからだったのでした。


ちなみに、僕は初めから賛同者リストに名前を連ねる予定だったのですが、転職のあれやこれやで手続きが遅れてしまい、2ヶ月遅れでの掲載となりました。。。


ともあれ、この7月から一気に「データサイエンティスト」の語がバズり始め、人口に膾炙するようになっていったという印象があります。その勢いはGoogleトレンドにも如実に表れていますね。


f:id:TJO:20131229172803p:plain


なお、この前後の時期にデータサイエンティスト絡みで今でも必ず引き合いに出される有名な本が2冊出てます。ついでなのでAmazonリンク貼っておきます*2


データサイエンティスト完全ガイド (日経BPムック)

データサイエンティスト完全ガイド (日経BPムック)

データサイエンティスト養成読本 [ビッグデータ時代のビジネスを支えるデータ分析力が身につく! ] (Software Design plus)

データサイエンティスト養成読本 [ビッグデータ時代のビジネスを支えるデータ分析力が身につく! ] (Software Design plus)


前者は経営者向け、後者は実務者向けという住み分けが多分妥当だと思います。ちなみにそれぞれ書評も書いてます。


前者への書評が異様に辛口ですが(笑)、まぁそもそもこの元雑誌自体がほぼ完全に経営者向けのもので、データサイエンティストを「雇いたい」人が読むべきものだったのでしょう。そういう意味では後者はまさしくデータサイエンティストに「なりたい」人向けの本だったと思います。というか、後者の養成読本は異例のベストセラーになりましたよねー。僕の書評が少しでも貢献したなら嬉しい限りです。


そうそう、7月は転職の挨拶回りも兼ねて色々なデータ分析業界の方々と飲み会の席を設けてもらいました。これらの席で初めて直接お会いできた方も多くて、嬉しかったです。当時は僕も初々しかったですねー*3


夏以降になって大手メディアへの露出が激増


これぐらいの時期から、IT業界メディアのみならず一般大手メディアにもデータサイエンティストのことが取り上げられるようになりました。某民放TV局の深夜ニュースとか、某公共放送の特集系番組とか、色々なところでデータサイエンティストとは何ぞや系のネタが出るようになったと記憶しています。


で、個人的な印象としてはこの頃から一般大手メディアのデータサイエンティストの取り上げ方がIT業界におけるそれへの認識から乖離するようになり、僕の周囲のIT業界系データ分析者コミュニティ諸氏から「あれちょっとおかしくね?」的なネガティブなコメントが出てくるようになったような。ま、その辺のあれやこれやはこのブログでも度々記事にしているので皆さんもご存知かも。


そう言えば、その勢いが飛び火したのかTokyo.RやTokyo Webminingと言った勉強会がどんどん人気を博していって、参加登録しようにも満員で登録できないみたいな事態に拍車がかかるようになったのも、この頃じゃありませんでしたっけ?


8月は僕個人としては2回ほど公の場でお話する機会がありました。1つはCatchball 21様の勉強会で、主にマーケッターの方々を対象に「データサイエンティストとは何ぞや」的なお話を。



そしてもう1つは、まさに超人気勉強会になったTokyo.Rの第33回で計量時系列分析のCRANパッケージをざっくり超駆け足で紹介するみたいなネタをお話したのでした。



この会のTokyo.Rでも色々な方々と初めてお会いできて、大変有意義でした。そう言えばこの時に「研究者だった頃の研究テーマの話も聞きたい」というリクエストを頂いたんですが、未だにやってませんね。。。(汗)。


9~10月以降はまさに秋風が吹いて飽きられる勢い


こんな感じで9月半ばぐらいまでは猛烈にデータサイエンティストはバズり続けてたんですが、10月ぐらいになると一気にブームから醒めた感じになり、依然として狂想曲を繰り広げる大手メディアを尻目に(特に)IT業界ではシラケムードに切り替わったという印象です。この辺の話は既に記事にしてますが。


個人的な観測としては、やはり大手メディアが騒いだ割にデータサイエンティストが単純に周りで増えたとか、需要が増したとか、そういうデータサイエンティストの存在を実感するようなシチュエーションをほとんどの人が経験しないまま、何ヶ月も経ってしまったというのが大きいのではないかと。実際、7月前後にバズって以降にデータサイエンティスト職やその他データ分析職を新設した企業ってほとんど聞かないので*4


結局、実態を伴わず、ただ単にバズワードとして消費するだけかのようなコンテンツを、大手メディアが矢継ぎ早に出したところですぐそばから受け手に幻滅されるだけという、最近ありがちなパターンを地で行っただけになってしまったというのが本当のところだと思います。


ちなみに、実はこの時期からめっきりヘッドハンティングの勧誘も減りました。7月頃は毎日毎週の勢いで勧誘のメールやらDMやらが来てましたが、10月以降はさすがにまばらになってブーム終焉だなぁと思わせる感じです。


ところで10月には第30回Tokyo Webminingでお話させていただいたのでした。テーマは相変わらず計量時系列分析だったんですが、細かい数式の話よりも「それを使ってデータをどう理解するべきか」に重点を置いてお話してきました。



この席上で、3月に一度お話する機会のあった楽天の北川拓也さんと再びお会いできて、なかなか中身の濃い議論を楽しませていただきました。こういう会がまたあったら良いなぁと思ってます。


11月はZansaの会第17回勉強会で、身も蓋もないデータ分析現場の現実のお話をしてきました。マエショリスト、僕は目指してるつもりは全くないんですがなれそうな気がする今日この頃(汗)。



この後はNIPS2013に参加してきたり、R Advent Calendar 2013に参戦したり、現職の新卒採用イベントに出たり、とか色々ありましたが、全部挙げるときりがないのでひとまず置いときます。


そうそう、技術の話を全然してなかったので一つだけ。今年は夏ぐらいからBUGS / Stanが流行り始めたなぁと感じていて、僕個人も随時キャッチアップしていくようにしています。何だかんだでアドホック分析系にとっては、BUGS / Stanは最終兵器だと思ってますので。


来年以降はどうなるのか?


で、来年以降「データサイエンティスト」はどうなるのか?についてですが。これは前々からも言ってますが、端的に言ってしまえば


データサイエンティストを必要としている現場ではその現場内に限って今後もどんどん増えるし、必要としていない現場ではどんどん現場ごと撤退していく


ただそれだけだと思います。つまるところ「『でーたさいえんてぃすと』ってのがブームだから」という理由でブームに食いついただけの現場が早々に幻滅して撤退or脱落していくだけのことで、真にデータサイエンティストを必要としている現場では今もなお着々と増強を進めていると聞きますので。


僕はたまたま一般向けの講演会の類も色々引き受けているので、割とデータサイエンティストを「雇いたい」側の人たちと話す機会も結構あるんですが、真剣にデータサイエンティストないしデータ分析専業部門の導入を検討してなおかつ実行している現場は少なくないです。ただ、現状では脱落者の方がずっと多いので、見かけ上は急激にブームがshrinkしている感じになってます。その辺の状況は、多分業界の外からは見えづらいことでしょう。


なので、これからデータサイエンティストないしデータ分析者になりたい!という人は、どんな手を使っても良いのでとにかく「真剣にデータサイエンティストを欲しがっている現場」を探り当てて、そこにアプローチすることを最優先にするべきだと思います。その辺の二極化が、来年はこれまで以上に大きく進むというのが個人的な観測です。


ということで。。。


この記事で今年は書き納め。また来年もよろしくお願いいたしますー。さすがにブログタイトルの「銀座」が変わることは来年はないと思います(笑)。でもデータサイエンティスト・バブルが完全に弾けてしまったら、タイトルの後ろ半分は変えるかも。。。

*1:誰だか分かったそこの人、公言しちゃいかんですよ(笑)

*2:僕自身はアフィリエイトやってないので、このリンクから購入されても僕にはびた一文入りません念のため

*3:今は超偉そうだとか突っ込まないように

*4:後述しますが、あるにはあります