六本木で働くデータサイエンティストのブログ

元祖「銀座で働くデータサイエンティスト」です / 道玄坂→銀座→東京→六本木

データ分析は「強者の武器」、駆け出しのうちはデータが貯まるまでの間に他にやるべきことがある

f:id:TJO:20180202163807p:plain
(Image by Pixabay)

こんな面白い記事が出回っているのを先日見かけたのですが。


この6年弱のデータ分析業界での個人的な経験や業界内で見聞してきた知見の範囲で言うと、そもそも「データ分析は『強者の武器』であって小さな組織が使っても強い武器にはならない」というのがあると思っています。言い換えると「スタートアップと呼ばれているうちはデータ分析以外のところに注力すべき」ということかと。ということで、その辺の話をざっくり書いてみようかと思います。


データ分析の効果は「掛け算」なので、元手が多くないと意味がない


これまで色々な場で色々なデータ分析の専門家によって言い古されてきた言葉*1とされるのが「データ分析の効果は『掛け算』」だということ。


つまり、データ分析の効果というのは一般には「売上プラス1億円」とかではなく「売上1%アップ」という感じになりやすい、ということです。すると当然ながら、毎月の売上高が100万円の小さな事業ではデータ分析の効果は1万円アップにしかならないわけですが、これが毎月の売上高100億円の大きな事業なら1億円アップになるというわけです。これは意外と理解されているようで理解されていないポイントだと思います。


言い換えると、駆け出しでまだ事業が小さいスタートアップがデータ分析を一生懸命やってその効果を期待したとしても、元手となるとビジネス規模が小さければ自ずとデータ分析の効果も小さなものに留まるということです。「データ分析は『強者の武器』」だと考える所以です。


それに比べると、例えばそもそも論としてビジネスの枠組みを考え直したり(現在のビジネス構造が芳しくないならピボット=事業の方向転換を考えることも必要)、アプリビジネスならUI / UXを改善したり、サービスの内容を改める・充実させると言った、データ分析以前のところを頑張る方が意味があると思います。そうしてビジネスの規模が大きくなってから、ようやくデータ分析に着手したとしても遅くはないはずです。


ちなみにスタートアップでのデータ分析という文脈で話をしていますが、別に大企業でもシチュエーションを限れば話は同じです。全社マーケティング戦略をデータ分析に基づいて改善していけば大きな効果が得られるものと期待できますが、新規事業の小さなアプリ開発マーケティングにおいて例えば日次DAUが1000人にも達しない段階で遮二無二高度な統計分析をやったり機械学習レコメンデーション機能を投入したところで効果は殆ど期待できないでしょう。


データ分析に取り掛かる前に、データ基盤を作る方が先決


ようやくビジネス規模が大きくなってきたからと言って「じゃあ早速データ分析に取り掛かろう!」と考えるのは時期尚早。何故なら、データ分析に取り掛かるためにはデータが必要だからです。「いやデータなんてその辺にあるでしょ?」という向きが多そうですが、何も考えていない現場ほどデータ基盤の整備は全くされていないのというのが世の常です。


実際問題、「我が社には大量のデータがある」と豪語するところに限って社内の共有フォルダに神Excelの山が積まれているだけ、みたいなこぼれ話は枚挙に暇がありません。最低限ちゃんとデータ分析に使えるようなデータをシステムで自動的に集約し、DBそしてDWHなどの形でデータ基盤として整備する、というのがデータ分析を成功させるための第一歩です。ただし、後付けでそれらのデータ基盤を導入するのは結構大変だというのをこの目で見てきているので、できれば事業を開始したタイミングで同時にデータ基盤も入れるというのが理想的でしょう。


冒頭で引用した記事では「まずは誰もが見られる共通のダッシュボードを作れ、誰もがデータにアクセスできるようにしろ」と書かれてますが、まずはそういったダッシュボードとデータアクセスとを実現できるようなデータ基盤をいの一番に整備するのが良いと思う次第です。


データ分析の「7つの進化のステップ」


実は、先に述べたような話を2年前に記事にしていたのでした。その見出しだけ抜粋してくると以下のような感じになります。

  1. データをビジネスの「エビデンス(根拠)」とし、「データドリブン」に変えていく
  2. 次にデータを集めて「可視化」する
  3. データを比較して「A/Bテスト」する
  4. A/Bテストに「統計学的検定」で再現性を与える
  5. 「多変量モデル」を導入して同時に複数の要因にアプローチする
  6. 「モデルによる予測(推測)」で未来のアクションや意思決定をサポートする
  7. 機械学習」とその「システム実装」による自動化を導入し、人手による「アドホック分析」とバランス良く使い分ける

正直言って、統計学的検定を入れるかどうかとか、機械学習を導入する前に多変量モデルを使うかどうかとか、その辺の方法論の選び方や順番は本質的ではないのでどうでも良いです(笑)。大事なことは「データ分析には進化のステージがあるので、それぞれの現場のビジネスの状況に合わせて徐々にステージをステップアップしていくべき」ということなのかなと思っています。


冒頭に引用した記事は、そのステップのスタートアップ版を(原文の筆者の方が経験に基づいて)わかりやすくまとめたものなのかなと感じる次第です。僕が個人的に体験したり見聞してきたりした範囲で言えば「その時々のそれぞれの現場のビジネスの進化のステージに合わせて、最も良くフィットするデータ分析のステップを選んで、最も合理的なビジネス施策を打てる」現場こそが強い、という印象があります。


ビジネスが小さいうちはコンパクトなダッシュボードで追うべき数字を押さえながらスピーディーに施策を打っていき、少し大きくなってきたら細かく効果測定をしながら再現性高く良い施策と良くない施策とを見分けて出来る限り前者を打ち続けられるようにし、十分に大規模になってきたところで機械学習によるレコメンデーションなどのone-to-oneマーケティングなどの力技を導入して安定的なビジネス機会獲得を狙う。それが出来ているところほどグングン伸びていきますし、それが出来ていないところは残念ながら失速していっているというのを、この6年弱の業界経験からは感じています。


特に意外と規模を問わず多いのが「データをビジネスの『エビデンス(根拠)』とし、『データドリブン』に変えていく」という一番最初のステップすらまともに踏めていない現場。正直言って「ダッシュボードでも何でもいいからとにかく追うべき数字を可視化してください、折れ線プロットでも何でもいいから毎日どこかに掲示してください」みたいなところって全く珍しくないんですよね。なのに、そういうところに限って「人工知能で〇〇(物凄く高度に見える何か)をやりたい」とか言い出したがるという。。。いや、その前にやることが6ステップもありますよ、的な。


空前の人工知能ブームに伴ってデータサイエンティストブームが再燃するなど「ビッグデータ」や「データ活用」が改めて脚光を浴びつつある昨今ですが、そういうご時世だからこそ地に足のついたデータ活用戦略をとるべきだ、というのが個人的な意見です。

*1:ググったんですが初出がどこか突き止められませんでした、ごめんなさい