渋谷駅前で働くデータサイエンティストのブログ

元祖「六本木で働くデータサイエンティスト」です / 道玄坂→銀座→東京→六本木→渋谷駅前

施策の「レイヤー」とその規模に合わせて、データ分析の方向性を決める

これまで色々なデータ分析案件を自ら持ち(持たされ)、また色々な他所の現場のデータ分析の実態を聞いてきたわけですが、意外と未だに統一された共通認識が形成されてないのかなぁと思うのが「施策レイヤー&規模とデータ分析の方向性とのベストマッチ」。今回はちょっとその辺の話題をしてみようかなと思います。


3つの施策の「レイヤー」


そもそも、ビジネスの現場でデータ分析をやると言った場合、大体以下のようなフローになるんじゃないでしょうか。


f:id:TJO:20140704191117p:plain


この辺のフローは、どういう事業&マネジメントレベルであっても変わらないはずです。そこを踏まえた上で、一旦施策の「レイヤー」ということを考えてみようと思います。「レイヤーって何ぞや?」と言われそうですが、イメージとしては「対象とするカスタマーの規模別の階層」ってところでしょうか。


f:id:TJO:20140704190925p:plain


こんな感じで、上から規模の順に包含関係になっているものと僕個人は考えています。大事なのは、この包含関係になっている各レイヤーごとに何かしらのデータ分析を行い、何かしらの施策を打った場合の「影響度の大きさの規模」が違うということを再確認することかと。イメージとしては以下のような感じです。


f:id:TJO:20140704190938p:plain


極めて当たり前なんですが、トップのレイヤーで全体の事業の規模感が決まり、ミドルのレイヤーで中期的な右肩上がり(下がり)感を出し、ボトムのレイヤーで細かい日次レベルでのパフォーマンスをチューニングするという感じの使い分けになると思います。以下、それぞれについて詳説を。


潜在顧客レイヤー:プロモによる認知獲得などマスへの訴求


f:id:TJO:20140704191021p:plain


基本的には、マスとしてのユーザーとしか接触できないレイヤー。時定数が大きいor規模が大き過ぎる、そして個人レベルでユーザーをトラックするのが困難なため機械学習での最適化はほぼ不可能というのが特徴的。マクロな計量経済学に近いアドホックな方法論による分析が有効で、マスレベルでの施策決定でほぼ全てが決まるという印象です。マス広告の予算ポートフォリオ最適化などが代表的なデータ分析課題でしょう。


集客・送客レイヤー:導線や集客戦略のコントロール、そして広告配信の最適化など


f:id:TJO:20140704191011p:plain


間接的にカスタマーと接触するレベル。例えばweb広告配信の機械学習による最適化(図中にもあるようなオーディエンスターゲティングなど)もある程度有効なんだけど、パイの総量をコントロールするという意味でアドホックな分析に基づいて導線設計やカスタマーの属性などに基づいた集客戦略の細分化など、枠組みの方向性をいじる方が効果大だと考えてます。


消費行動レイヤー:カスタマーとのインタフェース


f:id:TJO:20140704191002p:plain


カスタマーが直接触れるレベル。なので、機械学習を用いてオンラインand/or動的に最適化が可能。レコメンドとかコンテンツの動的生成、はたまたソシャゲであればパラメータの自動調整など、個々のカスタマーごとの売り上げなりCVなりのパフォーマンスを逐一引き上げることで、レイヤー全体の数値を向上させるというのが目的になるのだと思います。


事業ステージによってどのレベルで介入するかは異なる


当然ですが、その事業がどのステージにあるのかによって、上記3レイヤーのどこでどのようにデータ分析し、施策介入すべきかは変わってくると思ってます。例えば、まだ事業の認知獲得が全くサチってもおらず伸びしろが莫大なケースでは、潜在顧客レイヤーでの最適化を狙ってどんどんマスプロモを打ち、認知を獲得した方が総体としてのパイは増えるし売上高も利益も伸びることでしょう。


むしろ認知はそこそこ獲得できているけど導線が最適でなくて集客できていないケースでは、集客・送客レイヤーを最適化すべきかと。パイの実質的総数をきちんと獲得することで、売上高や利益の上下動は抑え込めるはずです。


そして認知はサチっている、導線の最適化もサチっていて、人手で意思決定して何か改善できる状況にないのであれば、消費行動レイヤーを機械学習でシステム化&最適化して、可能な限り高パフォーマンス状態を維持し続ける方向を目指すというのが鉄板パターンになると思うのです。


レイヤーごとに「アドホック分析」「アルゴリズム実装」それぞれの適不適は異なる


「今後のデータ分析は『アドホック分析』系と『アルゴリズム実装』系とに分かれる」とこのブログや各地での講演で提唱して久しいですが、レイヤーごとにデータ分析の体制を組み替えることを考えると、この2種類のデータ分析をどう使い分けるかがポイントになってくると思います。


例えば、潜在顧客レイヤーでは完全に経営戦略レベルでの意思決定の最適化を求められるので、機械学習の出番はほとんどないと思った方が良いです。むしろ大規模集計データの変動を緻密に統計モデリングして、予算の重み付けや予算ポートフォリオの最適化といったところを追求するアドホック分析によるアプローチが最適なはずです。


消費行動レイヤーでは、いちいち細かい個々のユーザーごと・面ごとのデータを集計して膨大なデータを集めてアドホック分析なんてやっていたらキリがないですねー。機械学習でオンライン学習を行い、さらにユーザーへのレコメンドやコンテンツ配信もシステム化し、全自動でアクションが最大化するように漸近させていくようなアルゴリズム実装系のアプローチが適していると思います。


悩ましいのが集客・送客レイヤー。ここではweb広告のオーディエンス・ターゲティングのようなアルゴリズム実装系の仕事が生きる場面もあれば、導線や集客戦略の最適化など計測された数値データからアドホックに分析した結果に基づいて意思決定していく方が効率が良い局面もあります。バランスの良いチーム編成が必要になる、難しいレイヤーだとも言えそうです。


終わりに


この話題も交えて、今週末開催予定のハッカーズチャンプルーでお話するつもりです。こういうガチのエンジニアカンファレンスになんちゃってエンジニアの僕なんぞがお邪魔して大丈夫か心配なんですが(汗)、色々突っ込んでいただければ有難いですー。