渋谷駅前で働くデータサイエンティストのブログ

元祖「六本木で働くデータサイエンティスト」です / 道玄坂→銀座→東京→六本木→渋谷駅前

データサイエンティストがビジネスに貢献するために心得ておくべき「4つの定石」

この三連休にはてブで盛り上がってたこちらの記事、なかなか面白く拝読しました。


「あいつ・・・なにやってるの?」データサイエンティストを殺す4つの環境 - dataminer.me

データサイエンティストを殺すための4つの環境

  1. データサイエンティストの評価者がデータサイエンティストじゃないケース
  2. データサイエンティストが新しい発見をしてくれると思っているケース
  3. データ分析専業の組織がデータを出すことを目標にされているケース
  4. 勘や経験がすごく冴え渡っていて順風満帆な組織に参加させるケース


ということのようなんですが、これって多分見方を変えればものすごく単純なことなんじゃないかなーと僕は思うのです。「データサイエンティストを殺すための4つの環境」という刺激的なタイトルなんですが、裏を返せば「この4つの環境を逆に生かすor解決してしまえば無問題」なわけで。


そこで、僕が今まで見てきた様々な現場やデータ分析業界の知人友人から見聞した話をベースに、元記事をベースとして「データサイエンティストがビジネスに貢献するために心得ておくべき『4つの定石』」と題してざっくり論じてみようと思います。

データサイエンティストがビジネスに貢献するために心得ておくべき「4つの定石」

元記事の4つの「環境」に照応させる形で4つの「定石」としましたが、定石でもセオリーでも秘訣でもtipsでも何でも良いです念のため。

1. データサイエンティストは非専門家からも評価されてこそ価値がある

既に何度かブログでも書いてますが、これまでも、これからも、データサイエンティストはビジネスの現場では少数派であり続けるだろうと予想しています*1。なので、データサイエンティストの評価者がデータサイエンティストになるというケースは、これまでも、これからも、期待できないことでしょう*2


むしろ話としては完全に逆で、「非専門家(データサイエンティストではない人たち)に評価されて初めてデータサイエンティストは価値がある」ということなんじゃないかと思うのです。


そのためになすべきことはいくらでもあります。データ分析の結果を見やすく描く、分かりやすく説明する、常日頃からデータ分析とはどんなものかを理解しやすく(ランチの時や茶飲み話や酒の席でも)語る*3、社内or社外向けにデータ分析カルチャーの啓蒙活動をする、などなど。茶飲み話や酒席でのトークであれば、前処理のしんどさだのデータ引っ張ってくる手間だのも、笑えるこぼれ話として話せることでしょう*4


大事なことは、データサイエンティストとしての仕事を「誰にでも理解してもらえるようにする」こと*5だと思います。それさえできていれば、評価者にデータサイエンティストを引っ張ってくるという大変な労力はかからないし、逆に社内外に広くデータサイエンティストとしての仕事の価値を認めてもらえる結果になるはずです。


データサイエンティストならではの苦労であったり、工数がかかってしまったりする特殊事情も、その周囲からの広い理解さえあれば何とか受け入れてもらえるのではないでしょうか*6


実践的なtipsとしては、早い段階で事業サイドの人たちの中から数字に強い人やデータ分析に興味のある人を見つけて、その人たちと個々にコネクションを築いてしまうというやり方があります。事業サイドにデータサイエンティストの立場を理解してくれる人を草の根から増やしていくということですね。そういう人たちはいざという時に事業サイドの責任者との間を取り持ってくれたりすることもあるので、やってみて絶対に損はないと思います。

2. データ分析とは新しい発見をするものだという先入観を、データサイエンティストの側が与えてはいけない

割と最近よく言われる「データ分析は新しい発見をするものではない」というフレーズですが、裏を返すと「データ分析とは新しい発見をするためのものである」という誤解がそれだけ広まっているということですよね。


僕が見聞している範囲では、その誤解を口にしているのは必ずしも事業サイドばかりではないようです。肝心のデータサイエンティストの側がそれを言ってしまっているケースが少なくないように見受けられます。


例えば「○○というデータ分析をするとこれまでの普通のExcel集計結果では見えてこなかったものが見えます」「△△分析で可視化することでただ数字を眺めているだけでは分からなかったものが見えます」とか。あのー、データサイエンティストは○○or△△手法のセールスマンじゃないんですが*7


どんなデータ分析案件の席であれ、僕が必ず口を酸っぱくして言うのは

「データ分析は魔法の杖ではないし、何か見たこともない新しいものを生み出すものではありません」


「大半の場合は、これまでの勘や経験を裏付けるような結果しか出ないものです」


これを最初に言って、がっかりする事業サイドの人って実はほとんどいないんですよね。むしろ、これを聞いて「安心した」と言って下さる人たちの方が多い印象です。ある意味当たり前なんですが、データ分析部門の人間がしゃしゃり出てきていきなり「あんた方の今までの勘とか経験とか間違ってるかもよ」みたいなことを言われたら、カチンと来たり不安になったりする事業サイドの人たちの方が多いのではないかと。


なので、その上で僕はこういうことを言うことが多いです。

「ただし、大事なことは皆さんの勘や経験を数値化することです。こうすることで、客観的に見ても勘や経験が正しかったと証明できますし、皆さんの属人的スキルだった勘や経験を数値化することで、他の人にも共有してもらえます」


「そして数値化することで、いずれマーケットの状況が変わって勘や経験が利かなくなった時に、その原因が何かをいち早く感覚ではなく数値に基づいて突き止めることができます。それがデータ分析の最大のメリットです」


ここまでお話すれば、大体の事業の人たちにはデータ分析する意義を納得してもらえることが多い、というのが個人的な経験則です。今まで積み上げてきた事業サイドの資産を否定するのではなく、そこに新たに上乗せするというスタンスが大事だと思ってます。

3. データ分析専業部門は、事業の引き立て役に徹してこそ輝く

最近はデータ分析専業部門を設ける企業も増えてきているみたいですが、自ら事業を持って回すのでもない限りは、基本的には事業の「引き立て役」であるべきだと僕個人は考えています。


これは2番目の定石とも関連しますが、事業サイドにとってはデータと同じくらいこれまでの実績や経験、そして勘やノウハウというのは極めて大事なものであり、ある意味プライドの根幹をなすものでもあります。実際、どれほど細かくデータを取ってもなお数値化のしようがない勘とかノウハウというのは、どこの現場でも一定数あるもので、それこそが事業サイドのプロの人たちのバリューだと言ってよいでしょう。


なので、もしこれをデータ分析専業部門が自分たちで事業を回すわけでもないのに、データだけに基づいてあれこれ言ってきたら普通はカチンと来るものだと思うんですよね。「だって、あいつらただの外野なんじゃないの?」という。


そういう不幸な事態を避けるためにも、データ分析専業部門はまず第一に事業サイドが(勘でも経験でもノウハウでも良いので)どういうところに自信を持っていて「これはまだデータ分析の必要がないフェーズだ」と認識しているのかを把握することに専念すべきだと思うのです。その次に、事業サイドが自信がなくてサポートを必要としているところがどこかを把握するべきではないかと。


これが分かっていれば、当面は前者は事業サイドのプライドを尊重して特に何もせず、後者だけをサポートすれば良いという円満な関係から始めることができます。そして、いざ前者の側に問題が起きたとしても、後者のサポート実績で信頼を得ておけば前者のサポートにもスムーズに入れるはずです。


当たり前のことですが、基本的にはデータ分析サイドは「事業の引き立て役」、どんなに割合が増えたとしても「協業」であるべきです。どれほど優れたアナリストがいるプロ野球チームであっても、プレーするのは選手たちだということを忘れずに。

4. 「うまくいっている戦略を変えるのは愚かだ」

これは1950年代に大活躍した往年の名テニスプレイヤー、フランク・セッジマンの名言と伝わるものです*8。今のままでうまくいっているのならば、うまくいかなくなるまで続ければ良い。それを、何かしらの不安感や自信のなさから変えるのは愚かな選択でしかない。という意味の言葉です。


事業についても全く同じこと。百戦錬磨の事業サイドの人たちの、勘と経験で既に大成功を収めていて順風満帆というプロジェクトに対して、データサイエンティストがわざわざ寄与できることなんて基本的にはまったくありません。


というか、1番目にも書いた通り「事業に貢献してこそデータ分析は意味がある」わけですから、貢献する余地が特にないのならデータ分析をやって、あまつさえ既に順風満帆うまくいっている現場をかき乱す必要はさらさらありません。うまくいっている現場は置いといて、うまくいってない現場に行くべきです。うまくいってない現場こそ、事業サイドの人たちの勘と経験が既に効かなくなっているフェーズにあり、データサイエンティストの助言に耳を傾けてくれやすいはずなので。


もし、うまくいっている現場が実はバブルに陥っていると思うのなら、データだけもらって純粋に伴走(長期監視)させて欲しいと申し出れば良いだけのこと*9。勢いが翳り始めたところで、もう一度御用聞きに行けば良いのです。そうなれば、きっとデータサイエンティストの意見にも耳を傾けてくれることでしょう。

最後に

色々書きましたが、データサイエンティストの根本義を「ビジネスに(データ分析で)貢献する人」と置いておけば、どれも全くおかしなことではないはずです。言い換えると、その根本義を取り違えるからおかしなことになるのでしょう。


ちなみに元記事に倣って現職場のお話を少しだけ書いてしまいますが、現職場ではかなり多くの人が「有意差(統計的有意性)」の概念についての理解を持っているので、ぶっちゃけp値が直接絡む話でもすんなり理解してもらえるので大変有難く思ってます*10。「p値で見て有意でないのは陽性数がまだ少ないからorばらつきが大きいから」という説明も理解してもらえるのは嬉しいことです。


そして現職場に限らず、バリバリ仕事を回せる凄腕の人ほどやっぱり皆さんデータ分析のもろもろに対する理解が早いです。ちょっと前の記事でデータ分析を「させる」側の人たちに理解して欲しい「4つのコンセプト」という話を書きましたが、事業サイドで活躍している人たちはこういう話を延々としなくても、皆さんすぐ「あっそういうことなんだー」と理解しちゃうんですよね。ロジスティック回帰でもランダムフォレストでも決定木でも、そういう人たちはすぐ理解してくれるので正直助かってます。


この手の「事業サイドに理解してもらえない」問題で悩んでるデータサイエンティストというかデータ分析者の方々って結構多いみたいなんですが、様々な現場を見てきた身からするとぶっちゃけ「デキる事業の人と一緒に仕事をすれば良いだけのこと」と個人的には思ってます。。。

おまけ

そう言えば、今回もアドホック分析系&インハウス系の話ばっかりになっちゃいました。アルゴリズム実装系やコンサル系はまた事情が違うはずなので、悪しからず。

*1:今までは「不足している」と言われてきたのに、実際にはもう今後の需要の先細りが見込まれる状況なので

*2:データ分析専業コンサルや、社内独立採算制のデータ分析部門などであれば別ですが

*3:もちろん事業の人たちともランチしたりお茶飲むんですよー

*4:これが工数を莫大に食う元凶なんですが、正面切って真面目に言うと角が立つ話でしてね

*5:これこそが「コミュニケーション能力」

*6:それでもSIerみたいな人月商売のやり方以外認めないという状況に立たされた場合は、仕方ないので工数カウントの仕方を変えてもらうとか運動が必要になってきますが

*7:いや分析ツールを売るセールスマンだったら知りませんが

*8:某テニス誌で頻繁に引用されていたことがありまして。。。

*9:伴走だけして、特に何もせず放置するということ

*10:統計的有意性の概念についての理解が全くない人を相手にp値が絡む話をすると、まず最初に「p値とは何か」「何故5%を基準とするのか」「p値が大きい場合はどう理解したらよいのか」を全てゼロから話すハメになるので、手間がかかって仕方ないです。。。