先日までこちらの書籍を読んでいました。ここ数年「ワークマンのすごいデータ活用」としてそのデータ活用事例が大いにクローズアップされてきたワークマン社ですが、その裏側を取材した本書を読むとデータ活用も凄い一方で、それ以外の部分も凄いところだらけという印象があります*1。
その詳細については本書を実際にお読みいただくとして、今回の記事ではその中から僕が特に強いインスピレーションを覚えた箇所にフォーカスを当て、そこから今後の「データサイエンス」がどうあるべきかを個人的に考察してみようと思います。
先にこの記事で言いたいことを簡潔にまとめてしまうと、「これからは『データサイエンス』というよりも実験科学の考え方を転用した『ビジネスサイエンス』が重視されるべき」というものです。これまではビジネスシーンにおける「データサイエンス」が重視されてきましたし、それが故の狂騒を見かけることも多いのですが、最近になって「データ」サイエンスというよりも、もっと包括的で科学的なアプローチが重要なのではないかと感じる局面が増えており、その一つとして「実験科学的な取り組み」*2への理解がもっと広まるべきだという感想があります。これをあえて「ビジネス」サイエンスという語で括れないか?というのが、今回の記事のもう一つの主題です。
ワークマンの本当にすごいデータ活用
ワークマンのデータ活用については、ある程度まとまったメディア取材記事が公開されている*3ので、本書を読まなくてもこちらを読めば多少はお分かりいただけるのではないかと思います。これに限らず様々なところで称賛されているのが全社を挙げたデータ活用体制です。
これは本書第2章に挙げられている表です。「d3」というのは同社が導入しているPOSデータ分析システムですが、そのd3を用いたデータ分析とExcelを用いたデータ分析を、文字通り「社員全員」が必須のデータ分析研修を通じて学ばなければならないことになっているんですね。しかも習熟度を測るテストまでもが用意されていて、必ずしも合格最低点が設けられているわけではないようですが、90点ぐらいは取れて欲しいということになっているようです*4。これらの研修を通じて、「社員全員Excelデータ分析」体制が出来上がっているというわけです。
そして、同じ第2章に挙げられているもうひとつの表がこちら。全員必修のデータ分析研修で成績優秀と認められた中級者には、さらなるデータ分析の専門家としてステップアップするための別コースの研修が用意されていて、そちらを受講することで専門家の部署である「分析チーム」に配属される資格を得られるようになっている模様です。
本文を読むと、分析チームだけでなく商品部もこれらの研修で好成績を収めた社員たちが集まったことによって「第2の分析チーム」になりつつあるそうで、ワークマンのデータ活用導入の立役者となった専務CIOの土屋哲雄氏によれば
「商品を開発する以上は、きちんと売り切らないといけない。まずは数量を決める、サイズの分布(S、M、L、LLなどのサイズの幅)を考える。これが、かなり難しい。例えば、職人の方は筋肉があるので、サイズが大きめ。一方、一般の方は一回り小さくていい。だから、プロ客(職人客)と一般客がそれぞれどれだけ買うかという予測を立てないと、サイズが決定できない。柄も同じ。派手目の柄だったら、こんな人が買うから、こういうサイズ分布になるとか。それはもう、自分で仮説を立てて毎日データを見て、正しいかどうかを検証していくしかない」
とのことで、どんどんデータドリブンな意思決定が浸透しているとのこと。今や経営幹部までもが「加齢とともに学んだことを忘れていくから」という理由で毎年データ分析研修を必修で受けなければならないとのことで、まさに「薄く広く」データ分析が浸透しているのだとか。今や幹部クラスでもマクロを組むなどしてデータ分析ツールを作れる人材はザラで、最近導入された売れ筋商品の自動入荷ツールを作ったのは本社マネージャークラスの社員なのだそうです。現在では本社部長クラスへの昇格にも「データ分析のスキルに優れていること」が必須要件とされているというのだから、驚きです。
そんなワークマンがExcelデータ分析にこだわる理由は、土屋氏によれば「(ブラックボックスのAIとは違って)自分で考えるようになるからだ」とのこと。これは実際に市販のAIシステムを導入しようとして試験的に運用してみた経験にも基づくそうですが、一方で「AI導入は費用対効果に優れるので自社のデータ分析体制にもっと自信がつけばいずれは導入したい」ということで、AI導入については意欲的なようです。実際、第6章では「AI接客」という未来のプランが語られており、「突出したデータサイエンティストは要らない」と豪語しながらも、データサイエンス・AIの導入についても決して否定しているわけではないということが窺えます。
「ワークマンのデータ活用の原則は『浅く広く』。知識が浅い分を衆知という広さで補う。皆で考えて進化させていく。AIのようなスーパーパワーではなく、普通の人の知恵を集めて経営していくのが理想。それなら、むしろエクセルのほうがいい」(土屋氏)
他にも、ワークマンの自慢という完全自動発注システムも、プロトタイプは自社の社員がExcelで試行錯誤した結果得られたロジックをITベンダーに実装してもらったものだそうですが、その中にある気候条件の分析ルーチンはSASを利用しているということで、各所で喧伝されるように「徹頭徹尾Excelのみ」というわけでもないという点には留意する必要があるように思われます。
にしても、この種の小売業としては珍しくワークマンはEDI(電子データ交換)による電子取引を全ての取引先と結んで「在庫数量のデジタルデータ化」を済ませており(これも土屋氏が手掛けたもの)、データ活用といった場合に最初の障壁となる「データ計測・取得」の部分までもが達成されているという点が、さらなる凄みを感じさせます。
「リアル店舗A/Bテスト」「何もかもが実験」の凄み
しかしながら、ワークマンが凄いのはデータ活用だけではないんですね。それが「リアル店舗A/Bテスト」。第2章の後半及び第6章で詳細に説明されていますが、とにかくワークマンは「同時期に2店舗出してそれぞれに異なる取り組みを行った上でその差分を見る」というのがカルチャーとして根付いているんですね。そもそもワークマン自体の1号店・2号店が短期間に連続して出店したのに対して3号店を出店するまでしばらく間を空けたのも「店舗標準化のための比較実験を行っていた」からで、実際3号店以降ではその知見に基づいてほぼ全てを標準化したというので、これは「すごいデータ活用」以前からのカルチャーと言っても過言ではなさそうです。
勿論そのカルチャーは現在も健在で、話題を呼んだ「ワークマンプラス」の出店に際しても「ワークマンプラスへの一店全面改装」「部分改装」との店舗間A/Bテストを実施して、「部分改装」の方が費用対効果が高いということでそちらに方針を統一したという話が紹介されています。第6章で紹介されている「時間帯によってはワークマンプラスに変身する」店舗も、おそらくそういったA/Bテスト結果を踏まえたものなのでしょう。
一般には、自社事業そのものに対してA/Bテストを行うことに対しては慎重な企業の方が多いという個人的な印象があります。それはやはり「A/Bテストという名目で何かを『やらなかった』場合に何かしらの利益の逸失が起きるのは耐えがたい」「実験した結果成功と失敗とがくっきり分かれてしまうと何かと困る」*5という人が多いからでしょう。しかし、そこでずるずると「全てにおいて同じことをやり」「うまくいったかどうかは全体の売り上げの上がり下がりでしか評価しない」というような大雑把なやり方を続け、実際には効果の低い施策を延々と続けてしまうという企業の話は少なくありません。
その点で、オンラインですらないオフラインの、しかも実店舗というある意味「常識的に考えて絶対に失敗できない」領域でA/Bテストを平然と敢行するワークマンの独自性は際立って見えます。
ちなみに、第2章には余談として「駐車場の利用率調査」というフィールドワークの話題も出てきます。これは土屋氏が自ら各店舗に足を運んでフィールドワークを行ったもので*6、職人客メインの時代は3〜4台分あれば良いと結論づけて小さめの駐車場だけを用意してきた一方、POSデータから駐車場の利用率を予測できるようにしたとのこと。現在ではワークマンプラスの展開で一般客が増えてからは逆に20台分以上の駐車場を用意するようになったそうです。こんなところにも、「データの取得」「その適切な分析」というワークマンの企業としての姿勢が光ります。
「データサイエンス」に閉じない「ビジネスサイエンス」の可能性
以上のようなワークマンの凄みを本書では様々な角度から切り出して取り上げているのですが、それらを読んでいて僕はふと気付いたのでした。「これは、実はビジネスでサイエンスをやっているだけのことなんだな」「だがビジネスにサイエンスを持ち込める企業はほとんどないからこそ、このような取り組みに価値があるのだ」と。即ち、「科学的方法」に基づいてビジネスを回すということですね。そのエッセンスを、上記リンク先のWikipedia記事から抜粋してきたのが以下の5項目です。
- 測定可能性、測定原理の存在
- 定量性
- 再現性
- 統計的な有意性
- 論理的整合性
個々のビジネスシーンにおいて「データを計測可能にし」「数値としてデータを取得し」「一定期間の観察を経て再現性を確認し」「A/Bテストで差分を確認し」「確認された事実に基づいてビジネス戦略・戦術を決める」ということは、まさにこれらの5項目に沿った営みです。コンサル業界ではお馴染みのPDCAも科学的方法のプロセスとして挙げられている点を見るにつけても、これは妥当な見方であるように思われます。
僕のような研究者上がりの人間にとっては、科学的方法もIMRADも若かりし頃から慣れ親しんだ枠組みですが、そうでない人にとっては理工系諸専攻で学位論文*7を書く経験をしない限りはあまり馴染み深くないものかもしれません。そういう事情が、ビジネスシーンにおいてなかなか科学的方法に基づくアプローチが取られにくい要因をなしているようにも見えます。
実際、データサイエンスを導入したいと言っている現場にあっても、肝心の「柔軟なA/Bテストの実施」や「適切な条件統制の行われたマーケティング実験」の導入には拒否感を示す人々は少なくありません。それは先述したように「逸失利益の懸念」や「失敗したくないという気持ち」によるものもあれば、場合によっては「A/Bテストのロジック自体が理解できない」*8ということもあったりします。これでは、統計分析や機械学習やデータエンジニアリングは導入されても、肝心の「サイエンス」が導入されないことになり、まさしく「仏造って魂入れず」を地で行く話です。
これらの点について、旧知のしんゆうさんがこんな至言を述べておられました。
「ビジネスをサイエンスする」ための手段の1つである「データサイエンス」だけが先行してしまったことがそもそもの問題だと思ってます。
— しんゆう@データ分析とインテリジェンス (@data_analyst_) 2020年10月6日
そうそう、これなんですよね。元々は「データサイエンス」とは「ビジネスをサイエンスする」ための手段の一つでしかなかったのに、いつの間にかそれ自体が主役と化した上に目的にまでなってしまった。それこそが、現在の「データサイエンス」の迷走を招いた理由でもあるのでしょう。
そこで、シンプルに「検証すべき仮説を立てる」「データを計測できる枠組みを作る」「実験(A/Bテストや統計的因果推論)を行う」「得られたデータを分析する」「結論を出す」という科学的方法に基づくサイエンスのフレームワークをビジネスに適用した、いわば「ビジネスサイエンス」こそがもっと広まるべきではないか?と考える次第です。そして、本当に大事なのは「データサイエンス」ではなく「ビジネスサイエンス」の啓蒙なのかもしれません*9。
感想など
ワークマンが取り組むExcelデータ分析の内容について、もしかしたらデータサイエンス界隈からは「Excelをちょっと触ればできるようなものばかりでレベルが低い」という声が出るかもしれないと思ったのですが、仮にそういうレベルのものであったとしても「社員全員が遍く出来る」ことは物凄く大事だと思っています。
というのは、こういう大企業のデータを分析する際は中央の高スキルなデータ分析者が悉皆的にデータを集めて分析するよりも、むしろ各店舗・各地域の担当者ごとで簡便な分析を行いその結果をメタアナリシスで統合した方が、全体のトレンドを分析する上では効率的なこともあるからです。
そして印象的だったのが、各種メディアで喧伝された「突出したデータサイエンティストは要らない」というキャッチフレーズには、実は「今現在の段階では」という註が付されるべきだった、という趣旨の解説でした。僕の目には、むしろこれほど社員全員がデータに対するリテラシーの高い会社であれば、突出したデータサイエンティストであれ高度なAIシステムであれ、活躍できる余地は大いにあるのではと映りました。そういう取り組みは、今後ワークマンプラス業態が伸びていくにつれて進んでいくのかなと期待しています。
*1:そう言えば某所で「いやOpenWorkの口コミ見てみろよ」というツッコミが飛んでいるのを見かけましたが、見なかったことにしておきます
*2:ここには統計的因果推論なども含まれる
*3:ただし有料会員限定パートが多い
*4:正確には「平均点が90点ぐらいになるように難易度を調整してある」「むしろ90点ぐらいの点が取れるということで新入社員には自信を持ってもらうようにしている」ということなので、心理的影響まで考慮されている点が凄いと思われる
*5:査定に響くとかいう理由で嫌がられたり
*7:ここでは新卒就活で企業社会へと入っていく学士・修士を想定する
*8:特にDIDなど統計的因果推論を伴うと起こりがち
*9:そういう「ビジネスサイエンス」の啓蒙書をまずお前が書けと突っ込まれそうでgkbrしています