渋谷駅前で働くデータサイエンティストのブログ

元祖「六本木で働くデータサイエンティスト」です / 道玄坂→銀座→東京→六本木→渋谷駅前

個人的に5年間のデータ分析業界見聞録をまとめてみた

f:id:TJO:20171011153638p:plain
(Photo credit: https://pixabay.com/en/data-dataset-word-data-deluge-1188512/)


人工知能ブームで世間が喧しい昨今ですが、それに伴って往年に見かけたような内容のビッグデータ論やデータサイエンティスト論や機械学習システム論が再び出回るようになってきているようで、歴史は繰り返す感を覚える今日この頃です。


ということで歴史が繰り返している感を再確認すべく、これまでのデータ分析業界の5年間を僕個人が見聞してきた範囲and/or記憶している範囲and/orサーベイできる範囲で振り返ってみようと思います。ほぼ完全に個人的にして私的なヒストリーのまとめですので、公的な用途には参照されぬよう厳にお願いいたします。。。また僕の守備範囲が「広告もしくはマーケティング」であるが故にこの2領域に偏っている点もご注意ください。特に機械学習サイド及びシステムサイドの歴史については僕自身が機械学習のド素人かつエンジニアではないが故に見落としや失念が多いと思われますので、むしろお気付きの点はどんどんご指摘くださると有難いです。


もしかしてこの見聞録自体GitHubに上げて、他の方々からPRを編集提案を受け付けるみたいなことをした方が内容の妥当性や信頼性を担保するには良いのかな?とも思ったんですが、それをやるかどうかは様子を見てからにさせてくださいということで。

先史時代:古典的なR&Dと、クラウドビッグデータの始まりと、のちの有力プレイヤーの黎明期と


2011年以前は僕自身はまだ産業界にいなかったので、基本的には伝聞と個人的なサーベイで把握できる範囲のことしか書けませんということで予めご了承ください。というか詳しい方は是非ご教示くださいm(_ _)m


言うまでもなく、統計学機械学習と言った学問は2000年代はおろかそれより前にもずっと学術界のみならず産業界でも連綿と使われ続けていて、企業によっては新規の研究も盛んに行われていました。有名どころで言えばやはりVC理論とSVMの父とも言えるVladimir Vapnik (AT&T, NEC America, Facebook)やPRMLの著者としても広く知られるChristopher Bishop (MSR Cambridge)あたりが挙げられるかと。日本国内でも老舗企業の研究所を中心にR&Dが行われていたということも、僕よりもだいぶ先輩に当たる世代の方々から伺っています。


とは言え、そういう意味では2011年以前は古典的なR&Dの方がむしろ主流派だったのかなという印象があります。現在大流行しているDeep Learningも我らがGeoffrey Hinton先生が既に2006年にNN復権を期してScienceに論文を掲載して学術界では知られていたものの、産業界ではそこまで広まっていたわけではなかったようです*1。それもそのはずで、Googleが「猫を認識するDeep Learningを組み上げた」と発表してセンセーションを巻き起こしたのが2012年の6月なので。。。ちなみに神経科学の端っこの分野のボンクラ研究者だった僕も、恥ずかしながらDeep Learningについては当時は噂以上のことは知りませんでした。


むしろ、この時代にバズワードだったのはおそらく「クラウド」とか「ビッグデータ」だったのでしょう。クラウドに関してはWikipedia記事を読む限りでは2007-9年頃にブームが始まった模様で、一方ビッグデータに関してはMapReduceアルゴリズムが公開されてHadoopが開発されて以降だと考えるとやはり2007-9年頃がブーム開始時期だと見ても良いのかなと思います。前々職で当時の新卒エンジニア*2が自前でオンプレのHadoopクラスタを組んだのも09年だと聞いています。


一方、データ利活用という点ではまず「統計学」が話題になっていたようです。例えば2009年のNYTの記事では、Hal Varianが「次の10年で最も魅力的な仕事はstatisticianだ」と説いていると紹介しています。この時点で既に「21世紀で最もセクシーな職業」という言葉の萌芽が現れていたのだなということが分かりますね(笑)。

また有名な技術ブログのPublickeyさんのところにリンク切れ記事の紹介だけが残っていますが、2010年にはMicrosoftデータマイニング機械学習統計学が長期的に見てホットな分野になるという記事を公開していたそうです。少なくとも海の向こうのtech industryではデータ分析産業が向こう10年で流行るだろうと予想していたということは間違いないでしょう。


そう言えば最近ちろっと話題になっていた「大学から企業への頭脳流出」という件も、実はこの先史時代に既に始まっていました。代表的なのはやはり先述のHal(2007年にGoogle入社)ですが、日本でも東大の助教を辞してIT企業のデータ分析部門の責任者に転じた人がいたりします。今でこそ当たり前に見かけるようになった「物理学の専門家→データ分析職」という流れも、既にこの頃からあったようです。


また、のちにビッグデータ活用のメジャープレイヤーとなる日本企業のうちいくつかはこの時代にデータ分析プロジェクトを立ち上げています。具体的な社名を文字に起こすのは控えさせていただきますが、例えば09年頃から始まった事例とか、10年頃から始まった事例などは、僕が産業界にやってきた頃には既に業界内で広く知られていました。実際、転職活動の際にもそれらの事例についての紹介や資料を見せられた記憶があります。

先史時代の追記

[twitter:@Woofer30]さんからこのような情報を頂戴しました。なるほど、2000年一桁代でもこういう動きがあったのかという驚きがありますね。。。


2012年:「21世紀で最もセクシーな職業」データサイエンティストの登場、そしてデータ利活用の浸透


そして2012年、ついにあまりにも有名なあのうたい文句がやってきます。「データサイエンティストは21世紀で最もセクシーな職業だ」という刺激的なタイトルのThomas Davenportの論説がHBRに掲載されたのが、10月のこと。今でこそ知られた言葉になっていますが、当時の「データサイエンティスト」という聞き慣れない言葉の耳ざわりの悪さと言ったら。。。いや今でも大して耳ざわりが良くないかもですが(笑)。


以前の記事でも書いたように、12年の6月に僕は産業界にやってきました。採用された時のうたい文句は、今なら自ら嘲笑せざるを得ない感じですが「統計分析に秀でた脳研究者上がりの専門家」でした(汗)。こんな売り文句でも採用してもらえる程度には、まだ当時のデータ分析業界は成熟していなかったということかなと思います。これまた別の以前の記事に書いたように、前々職の当時のCTOから「尾崎さんはData Scientistってことでいいよね?」と言われて以来データサイエンティストという肩書きになっているのですが、この頃はまだ日本にはデータサイエンティストという言葉は入ってきてすらいなかったので「それって何の仕事ですか?何をやるんですか?」みたいなことを物凄くチームメンバーからも言われて詰められるみたいなことがあったのを思い出します(笑)。


そして先述の「猫を識別できる」GoogleのDeep Learningの話題が降ってきたのも同じ頃。あまりにも凄いパフォーマンスだと言うので、当時のチームメンバーの一人が定例ミーティングにその資料を持ってきたのを覚えています。ただ、当時はそれを実装するための手段が殆どなかった(単に当時TheanoやPyLearn2*3について詳しい人が周囲にいなかっただけかも)ので、実装しようという話題にならなかった記憶が。。。なおこの年のILSVRC 2012ではHinton先生のグループのCNNが大幅な精度向上を見せつけて優勝し、以後画像認識と言えばDeep Learning (CNN)という流れが定着しています。


僕は日本国内の事情しか把握していませんが、この時点ではまだ機械学習によるone-to-oneマーケティングを行なっていた事業者は指折り数えるくらいしかいなかったはずです。ソシャゲ企業にパイオニアが目立っていたイメージですが、裏側に回ると神Excelで人力運用していたところも多かったと聞きます*4


どちらかと言うと当時はまだオンプレHadoop全盛の時代だったので、そこからマーケティングに使えるデータを分析者たちが自らHiveとかHueとか叩いて取ってきて、それを統計分析してインサイトを導き出すみたいなところの方が主流派だったのではないでしょうか(確信はない)。僕も当時はHadoopクラスタからデータを取ってくるだけでなく、BIシステムの集計バッチやスケジューラーを書くみたいなエンジニア仕事をやらせてもらったりしていたものです。イメージとしては、ユニークユーザー(UU)レベルでのデータは何でも格納されていて幾らでも取り出せるけれども、何に使うかの当てがないのでとりあえず色々な切り口からクロス集計してみたり、ロジスティック回帰してみたり、はたまた決定木にかけてみたり、ということをしていた感じです。


この時点で、少なくともマーケティング系の有力プレイヤー企業はビッグデータを貯め込み続けることに成功しており、そこから実務上の施策にどう結び付けるかはまだ各社手探り(一部は実験的ながら機械学習などを利用した自動化に移行)の段階だったと個人的には認識しています。


ところでごくごく個人的なことを書くと、12年頃はまだ僕は前々職の社内にこもりきりで全く社外の人と会ったりしていなかった*5ので、この頃業界全体でどんな感じだったかは後になってから聞かされるケースが多かったりします。その伝聞の範囲で言うと、先史時代にデータ利活用を開始していたプレイヤーたちはこの頃徐々に機械学習による自動マーケティングの導入を進めていたようです*6


2013年:日本でもデータサイエンティストが大ブームに、同時にデータ分析カルチャーも拡大


上記の本家版HBRの記事が邦訳版でも出たのが2013年の2月。これにより「データサイエンティスト」が日本でも大ブームになります。『データサイエンティスト養成読本』初版本が空前の大ヒットを叩き出したのもこの年の8月のことです。Googleトレンドで「データサイエンティスト」の語が最大のピークを見せたのもそのちょっと前の7月のこと。この年はとにかく既存のIT産業系メディアもこぞって「データサイエンティスト」の特集を組むわ、ナントカ協会なるものが創設されるわ*7、異常なまでのブームになったのを覚えています。


この年は12月にネバダ州・レイクタホで開催されたNIPSに会社からの派遣ということで行かせてもらったりしたのですが、割とUSでも辺鄙なところで開催したにもかかわらず参加者が数年前に比べて何倍にもなっていたとかいうので驚いたのを覚えています*8。この時はまだDeep Learningの発表もそこまで多くはなく、オーラルでもDropoutの数理的基礎とかそういう話題をしていた時期なんですが、一方でキーノートでもバリバリの実務系の話がされるなど「あれ?ここって理論系のカンファレンスだと思ってたんだけどそうでもなくなってきてる?」という印象を持ったものでした。最近のNIPSが1万人近くも参加者を集め、企業からの参加や発表がものすごい数になっているというのを聞くと、その萌芽がこの頃にあったのかなという気がします。


個人的な話ですが、このブログを書き始めたのがこの年の3月のこと。その後7月に前職へと転職し、その直後ぐらいから積極的に社外のデータ分析業界関係者の方々と交流を持ったり、TokyoRやTokyo Webminingといった各種データ分析系の勉強会に参加するようになりました。データ分析業界各社の状況についても知る機会が増えるようになったのもこの頃です。その意味で言うと、この時点で機械学習による自動マーケティングやone-to-oneマーケティングの導入を進めている企業は日本国内にもあったように思います。ただ、Deep Learningはまだ浸透しておらず*9、全体的にまだまだロジスティック回帰やSVMやランダムフォレストで何かをやる、というレベルだった印象です。ちなみに当時はDeep Learningをやると言ったらTheanoかPyLearn2に限られるという状況でした(こんな例も)。いや、その頃は自動微分があるなんて素晴らしい!と言っていた時代なので、それでも随分と進んだなぁと思ったものです。


この時点では、広告・マーケティング系の有力プレイヤー企業自体の数も徐々に増え始め、潤沢に貯め込んだビッグデータに対して古典的な機械学習手法を当てはめて実務上の施策につなげる(もしくはシステム化させる)ところも出てくるようになってきていた、と個人的に認識しています。同じ頃からパブリック・クラウドが浸透し始め、データの貯め先もデータ処理の基盤もクラウドに移行するところが増え始め、当時の技術系発表資料でもクラウドのロゴが出てくることがちょくちょくあったような。


ところで、この年はHinton先生のGoogle入社、LeCun先生のFacebook入社とDeep Learningの始祖たちのtech industryへの移籍が相次いだ年でもありました。日本からは見えないところで実はこの頃からDeep Learningの進化の流れが加速していたのかも、という気がしますね。


2014年:データサイエンティスト・ブームは萎んで幻滅期に突入するも、データ分析カルチャーはますます拡大、他方で機械学習Deep Learningの産業界への浸透が始まる


この年の8月に拙著を刊行しているんですが、当時の風潮としては完全に「データサイエンティスト(カナ)」という残念な流行に対して(特に)IT業界からモロに逆風が吹き付けていたというのが実態でした。その辺の有様については上記の記事で振り返っているので興味のある方はそちらもどうぞ。とにかく「こんなのがデータサイエンティストとか名乗ってブイブイ言わせてるのかよアッハッハー」みたいに嘲笑される雰囲気が蔓延していて、極めて肩身が狭かったのを思い出します(泣)。


とは言え、データ分析カルチャーそのものはますます拡大していく状況にあったのも事実で、例えばTokyoRもTokyoWebminingもこの頃から急激に参加申込者が増え始めて「参加登録開始したと思ったらもう満員」というケースが続出するようになったのを覚えています。僕もTokyoRに参加するのは諦めて、年末のJapan.Rの方だけに参加するみたいな有様でした。そう言えばGlobal TokyoRとかいうイベントもあったような。。。また、拙著に限らずTokyoRコミュニティを中心としてデータ分析に関する書籍の出版ラッシュが始まったのも確かこの年のことだったはずです。


データ利活用のプレイヤー企業についてはこの頃幾つか大きな動きがあり*10、それまでの有力プレイヤー企業から人材が流出して新たな別のプレイヤー企業に移ってそこが有力プレイヤーになるといった事例がちらほらありました。端的に言えば「データ利活用プレイヤー企業の業界再編」だったわけですが、この時期を境にしてデータ分析業界では名前を聞かなくなってしまった企業もあったり。。。なおこの頃から日本でも広告関連業界のデータ分析人材登用が目立つようになったと認識しています*11


ところで、この年にCaffeが登場したことで徐々にDeep Learningが産業界にも広まり始めます。当時の僕のチームでもCaffeを触ってみようという話が出ていましたし、実際に使っているらしいという他社の話を聞く機会もチラホラありました。ただ、GPUをどうやって導入するんだ?というところでつまずくことがあり*12、なかなか実際の導入が進まないところが多かったような。。。一方で機械学習システムを実際の本番環境に導入して、成果を挙げ始めているという現場の話題を聞くようになったのもこの頃です。実際にはもっと以前から導入されていたところも多いのでしょうが、特にDSPなど第三者配信系広告の運用に機械学習システムを導入するとか、ターゲティング広告に機械学習を使い始めたみたいな話もこの年に多く聞いた印象があります。


あと局所的な話題を出すと、データ分析業界コミュニティ内ではこの頃からStanを初めとするMCMCサンプラーによるベイジアンモデリングが流行り始めたのを覚えています。そう言えば僕もその流行に乗っかった結果として[twitter:@ibaibabaibai]先生と交流させていただくようになったのでした*13

2014年の追記

そう言えば、この頃からオンプレのHadoopクラスタにひたすら貯めていたデータがクラウドストレージに貯める方向に変わり始めたという肌感覚があります。あとSparkの登場も大きかったのではないかなと。僕はSpark覚え損ねましたが。。。あとはクラウドコンピューティング&DWHへの移行が進んだという印象です。僕もこの頃から自腹でクラウド環境に課金して色々覚えたのを思い出します。ただしそういう流れへのアンチテーゼというわけではなかったと思いますが、巨大なオンプレ分析用クラスタを組んで巨大なNMFの計算を何ヶ月もかけて回しましたみたいな謎の事例を聞いたのもこの頃です(汗)。


2015年:不気味な静けさの一方で、グローバルでは動きが加速し、Deep Learningが流行し始める


日本のデータ分析業界的にはこの年は割と動きに乏しくて、自分の中でもあまり印象に残っていない時期だったりします*14。データサイエンティスト・ブームもほぼ下火になり、一方で機械学習系のプレイヤー企業の名前が徐々に世間でも目立つようになってきた、という感じでしょうか。


特記することがあるとすると、一つはデータ分析人材の需給状況について。前年までは明らかに中途採用市場がメインだったのですが、この年あたりから「データサイエンティスト・ブーム以降に学部専門教育・修士課程教育を経験して*15新卒でデータ分析職として企業に就職する」世代が増えてきます。当時伝え聞いた限りでは、学生の学科・専攻選びや研究室選びでも統計分析や機械学習を主たる研究テーマとするところが人気になり学生が多数殺到するみたいな事態がこの頃から始まっていたようです。それまでは「中途で主に独学」が多かったデータ分析人材に、新たに「新卒で大学(院)で基礎から学んできた」人たちが増えるようになったということですね。


もう一つはKaggleやKDD cupと言った機械学習コンペが日本でもホットなトレンドになったという点。何と言っても日本からKDD cup 2015で2位に入るチームが出たことが大きいと思います*16。それまでは一部の熱心なコンペ参加者にしか知られていなかったKaggleやKDD cupが日本でも(比較的)広く知られるようになり、「世界中のデータサイエンティストや機械学習エンジニアが集うコミュニティ」として人口に膾炙するようになったのもこの頃からです。


一方、グローバルではこの年に動きが加速した印象があります。例えばUberCMUから40人もの研究者(4名のfacultyも含まれる)を引き抜いたという事件もこの年のことです。Deep Q-Networkが話題になったのもこの年の1月のことでした。制御工学系出身の僕としては「へー、強化学習なんて今頃やるんだー」と思ったのを覚えてますが、その軽率な感想が間違っていたと気付くのはその翌年のことです。


そしてこの年の6月にChainerが登場し、11月にはTensorFlowも登場。いよいよDeep Learningは「誰でも触れる」時代に突入していきます。実際にDeep Learningをスクラッチから組むなりフレームワークを使うなりして、本番システムに組み込んで期待通りの高度な処理ができるようになったという話があちらこちらで聞かれるようになったのもこの年からです。なお、僕の前職のチームでもChainerを使って任意のスポーツの報道画像から何のスポーツをやっているかを当てるみたいな社内Kaggle的なものをやって遊んでいたものでした。ちなみに記憶が間違っていなければ結構な精度でサクサクぶち当てていた印象があります。引いたアングルから見たピッチの写真だけからでも、普通にサッカーって分かるんですね。。。いやアメフトなら線が引いてあるしラグビーならボールが違うし当たり前か。。。


ところでまたまた局所的な話をすると、この年はそれまでのDeep Learningに代表される機械学習が隆盛を極めるようになってきたアンチテーゼとしてか、統計的因果推論にデータ分析業界コミュニティでは注目が集まったのを思い出します。因果フェスという企画があったのもこの年のことで、そう言えばその前後にデータ分析においては因果推論をもっと重視すべきだという趣旨のテクノロジー系のメディア記事が出ていたものでした。

2015年の追記

この頃からデータ分析業界でもDockerなどコンテナを使った分析環境のデプロイが流行るようになった。。。と思います(皆さんご存知のように僕はシステム側は触らせてもらえなかったand/or触らなかったのでかなり疎いです)。GPUの普及などでデータ分析環境はクラウドコンピューティングで揃え、データ基盤はクラウドDWH「のみ」で構築するみたいなところも現れるようになり、オンプレでデータ分析環境を作る現場がどんどん減っていったというイメージです。


2016年:空前の人工知能ブームが到来、機械学習人材が大人気、グローバルではDeep Learningブームが過熱


この年の出来事として何をおいてもまず挙げなければいけないのは、とある囲碁AI*17の驚異の快進撃。永遠にコンピュータでは人類に勝てないと言われた囲碁において、Deep Learning強化学習モンテカルロ木探索によって構成され、自己対戦による学習で鍛えられたシステムが世界トップクラスの棋士に勝ち越してみせたということで一気に世界中で人工知能ブーム・AIフィーバーが湧き起こりました。たまたまそのタイミングで書いた人工知能入門的なブログ記事が異様に人気になったのはよく覚えてます*18


人工知能ブームが湧き起こったとなれば、当然のように機械学習にまつわるもろもろが大人気に。データサイエンティスト・ブームを彷彿とさせるかのような機械学習エンジニア・ブームが大沸騰し、この年僕のところに舞い込んできた首狩りメールの大半が「機械学習ができる人材募集」とか「Deep Learningが分かる人材募集」とかそんなのばっかり。もちろん機械学習の関連書も大人気になり、Python機械学習とかDeep Learningとかその他機械学習をテーマとした新刊書の話題を聞かない月はなかったかと思います。ちなみに1年経った今だから書ける話ですが、この年の秋には英語ブログのMXNetの記事を読んだというイギリスの出版社から「Deep LearningをRで実践するという内容で本(もちろん英語で)を書かないか?」という大真面目なメールが飛んできたことすらありました。ええ、これは大変丁重にお断りさせていただきました*19



他方でこの年になるとDeep Learningの研究開発もどんどん加速していき、いよいよ「俺が考えた最強のネットワーク選手権」状態になってきたという印象が。前年の時点であのResNetが既に出ていたのですが、この年からはDCGANやGNMTやWaveNetなどの革新的なネットワークが次々と出てきて、後からDeep Learningの勉強を始めた組としては「おいおいこんなのもう付いていけねーよ」という感じになってしまったように感じています。。。


また個人的に観測した範囲での印象ですが、この頃を境にこれまでITコンサルなど外部パートナーにデータ分析(特に機械学習システム構築)を委託していたユーザー企業が、次々と内製に向かうようになった気がします。データサイエンティスト・ブームが萎んだ頃はコンサルの求人ばかりが多かったこともあるのですが、この年からは改めてユーザー企業の内製データサイエンティストや機械学習エンジニアの求人が増えたという認識です。その意味で言うと(広告・マーケ畑から傍観してのイメージに過ぎないかもですが)従来のイメージの「ビッグデータ」にとらわれない、様々な形の事業データに対するデータ分析のニーズが人工知能ブームとともに掘り起こされていったのかもしれません。


ところで、この見聞録のもう一つのテーマが「大学から企業への頭脳流出」なのですが。前年は某分散処理系OSSの開発者氏の企業への移籍があったり、この年も業界内の誰もが知るCS界の若手エース氏の某社への電撃移籍もあったり*20、総体として見るとますますその流れが加速している感が強まったという印象です。USでの状況についても、この年の秋のNYTが良い論説を載せているのでお読みになると良いでしょう。「さらば象牙の塔、こんにちはシリコンバレーのキャンディストア」ってタイトルも大概だと思いますが(笑)。


なお個人的な話ですが、この年の1月に現職に入社しています。入社直後の3ヶ月で3回もシンガポールに飛ぶ羽目になり、飛行機旅行が大の苦手な身としては結構しんどかった思い出があります。。。

2016年の追記

そう言えば関連記事をかつて書いたのを完全に忘れてました。この年からクラウド事業を展開するtech企業各社とも機械学習APIを続々とリリースするようになり、学習済みモデルを利用するだけであれば普通にAPIを呼び出すだけであたかもプラモデルの部品を組むような感覚で機械学習による各種情報処理が出来るようになった、というお話です。この流れは2017年になっても加速し続けているように感じます。


そして2017年現在:留まるところを知らない人工知能ブームと、データサイエンティスト・ブームの再来と

ということで今年2017年に至るわけですが、人工知能ブームは留まることを知らないとはまさにこのことだなと感じています。Googleトレンドを見ても人々の関心は衰え知らずで、その期待感は膨らむばかり。人工知能機械学習に関するカンファレンスやセミナーやイベントの類にはますます多くの人々が詰めかけるようになってきていると思います*21。一方で、どう見ても疑問符をつけざるを得ないような内容の人工知能機械学習)講座やセミナーの類も日本国内では目につくようになってきて、この辺は往年のデータサイエンティスト・ブームを想起させる感がありますね。


arXivなどを見る限りではDeep Learningの研究開発はいよいよレッドオーシャンに突入し、機械学習エンジニアの獲得競争は常軌を逸したレベルに達しつつあり、海外ではPhD新卒の若手のホープが年俸100万ドル(>1億円!!!)を各社から提示されて札束が乱れ飛ぶ争奪戦になったという噂も出てくる始末。これらの世間の熱狂は冬の時代を少しでも知る身からすると隔世の感があります*22


そして今年はスマートスピーカーAIスピーカー)元年と言っても良いのではないかと思うくらい、tech大手各社からスマートスピーカーの発売が相次ぎました。今後も同様の機械学習に支えられたハードウェアが、人工知能ブームの象徴として次々と世に出続けることになるのではないでしょうか。かつてはwebで繋がったサービスの向こう側のサーバー(もしくはクラウド)の中にしかいなかった機械学習システムが、いよいよお茶の間に置ける家電として現れるようになったわけです。


あとは、ダイレクトな注目度という意味では人工知能ブームほどではないのですが明らかにホットなテーマになっているのが量子コンピューティング。今年はAQCが東京で開催され*23、折しも人工知能ブームによって計算効率の向上が叫ばれているタイミングでもあり、tech企業各社が取り組みを加速させていることも相まって確実に次の競争分野にしてレッドオーシャン(汗)になるのだろうと勝手に予想しています。

一方で人工知能ブームに煽られたのか、幻滅期を抜け出した「データサイエンティスト」に再び注目が集まりつつあるようです。Googleトレンドを見ても、2013年のピーク期のベースラインまで人々の関心が戻りつつあり、ついに「定着期」に達したのではないかと思わせるが如き有様が見て取れます。もっともこれはうっかりすると火事場泥棒なんじゃないかという気すらしますが(笑)、先行したデータサイエンティスト・ブームが作り出したデータ利活用カルチャーを人工知能ブームが補強したことによって、ようやく本来の意義が世間に認められるようになったのではないかという気もします。


そんな人工知能ブームなのですが、ひとつ面白い点があります。16年の振り返りでも述べたように、このブームによってデータ利活用のニーズが掘り起こされた結果、かつてデータサイエンティスト・ブームの頃に靡かなかった現場の多くでデータ利活用を推進しようという動きが出てきたようです。4-5年前に見かけたようなレベルの割とプリミティブなデータ分析課題が改めて注目されることが増えたように、各種メディア記事やデータ分析業界のコミュニティ内での伝聞からは感じます。その結果、4-5年前のデータサイエンティスト・ブーム時に散々聞かされたような話題が、2017年にもなってまるでさも新しい論点であるかのように取り上げられることが増えている、という印象を個人的には持っています。「温故知新」と言えば聞こえが良いですが、どちらかというと「周回遅れ」なんじゃないかという気がしないでもないような。。。


この人工知能ブームがいつまで続くのかは僕には分かりませんが、2年で幻滅期に突入したデータサイエンティスト・ブームと同じ道をたどるならおそらく来年2018年には同じように萎むのでしょう。そしたら、また2020-21年ぐらいに同じ話題が繰り返されたりするんでしょうか(笑)。


まとめ


僕のこれまでの5年間のキャリアはある意味2つのブームに振り回されてきたという側面もあるので、個人的にはブームから一歩どころか二歩三歩引いてひっそりと計量経済学とかもっと基礎的な統計学の勉強でもしていようかと思います。。。とは言っても生TensorFlowもある程度は書けた方が何かと良いだろうし、Deep Learningそのものの最先端のcatch upも多少はしておいた方が後々困らないだろうし、結局数学もプログラミングも大の苦手にもかかわらず勉強しなければいけないことが沢山あって訳が分からないというのが偽らざる心境ですorz

*1:Hinton先生のGoogle Scholarから確認すると、このあまりにも有名な論文も引用数が増えるようになったのはごくごく最近であることが分かる https://scholar.google.co.jp/citations?user=JicYPdAAAAAJ&hl=ja

*2:なお現在CTOをされている方です

*3:何がびっくりって、Theanoは2010年に、PyLearn2は2011年に既にあったんですね。。。今回調べて初めて知りました。。。

*4:記憶にある範囲だと、ソシャゲのゲーム中の施策のパラメータを神エクセルの「セルに数値に沿って色をつけてその色の並び方のパターンを見て施策を変える」みたいな職人芸みたいな運用をしていたところもあったそうで

*5:ただし旧Hapyrus・現FlyDataの藤川さんには来社された際にお目にかかったことがある

*6:技術導入やシステム開発という意味でも、組織運営・人材配置という意味でも

*7:そう言えば設立賛同人に名前を貸したような。。。

*8:そもそもNIPSは前の業界の頃から知っているカンファレンスなんですが、機械学習メインになって以降の事情は全く知らなかったもので

*9:もっとも前職で同僚だった「教授」氏は研究者時代の武器だったRNNを駆使して奇妙奇天烈なことをやっていましたが笑

*10:詳細は色々あるので伏せますが

*11:SNSに露出するようになった人々の顔ぶれを見ても、自分のところに飛んでくる首狩りメールの内容を見ても

*12:当時はまだGPUインスタンスをふんだんに提供するクラウド事業者は多くなかった

*13:これはのちに岩波データサイエンス企画に参画するきっかけになりました

*14:後述するように転職活動をしていたこともあってあまり業界動向をちゃんと観察していなかったという側面もありますが

*15:中には博士課程から来る人も

*16:ちなみに優勝した国際チームにも日本人の方が入っています

*17:この表現になっている理由については詮索しないでください笑

*18:ちなみにこの記事の公開日に某公共放送でAIをテーマにした番組を流すということは実は記事を公開した後になって知ったのでした

*19:日本語で本一冊書くだけでも苦労したのに、いかな英文校閲付きといえども英語でしかも本来の専門ではない機械学習分野であまつさえド素人がDeep Learningで本を書くとか一体どれほど大変なのか想像の範疇を超えていたので。。。

*20:プライバシーを考慮してどちらもお名前は伏せてあります、意味ないかもしれませんが笑

*21:そう言えば僕もこんなことをやっていました→https://www.youtube.com/watch?v=PARsDyRJMWE

*22:僕が卒論の研究室を選んだ頃は人工知能ニューラルネットワークというと「終わった分野」扱いされていたものでした。。。

*23:関係者に前職の同僚がズラリと並んでおります笑