渋谷駅前で働くデータサイエンティストのブログ

元祖「六本木で働くデータサイエンティスト」です / 道玄坂→銀座→東京→六本木→渋谷駅前

「データ分析の民主化」の在り方を、「社員全員Excel経営」が「社員全員データサイエンス経営」へと進化していった事例に見る

以前こんな記事を書いたことがあります。

「社員全員Excel経営」で名高い、ワークマン社のサクセスストーリーを論評したものです。2012年にCIOに就任した土屋哲雄常務のリーダーシップのもと、取引データの完全電子化を皮切りに「全社員がExcelを使いこなして数字とデータで経営する」戦略へと移行し、社内のExcelデータ分析資格を一定以上取得しないと管理職に昇進できないとか、はたまた幹部クラスの企画・経営会議ではデータに基づかない議論や提案は相手にすらされないとか、「Excelを社員全員が使えるようになるだけでもここまで企業カルチャーは変わり得るのか」という事例のオンパレードで、関連記事や書籍を読んでいて舌を巻いたのを覚えています。まさしく「ワークマンのすごいデータ活用」だったのです。


一方、個人的に強く印象を受けたのが土屋常務が様々なところでコメントしていた「我が社には突出したデータサイエンティストは要らない」というフレーズと、「社員全員がExcelを使えればAIの必要性は低い」という趣旨のコメントでした。勿論、高度な統計分析や機械学習のビジネスへの適用を生業とするデータサイエンティストたる我が身としては、それらのコメントはちょっとだけ残念に感じたものの、同時に「社員全員Excel経営であればそんなものはなくても十分なのか」と感嘆したものでした。


……ところが。最近以下のメディア報道を見かけて、僕は思わず大きな声を上げてしまったのでした。「おおおーーーーー!!!」と。


だが、Excelとて銀の弾丸ではない。データ分析が浸透したワークマンには、新たな課題が生じている。それは、分析内容が高度化するにつれ、Excelでは時間がかかるようになってしまったことだ。


たどり着いた2つの解決策。それは、データ分析に適したプログラミング言語Python」の習得をはじめとした社内教育の充実。そして、AWSのBI(ビジネスインテリジェンス)ツールの活用だ。

何と、ワークマン社では「社員全員Excel経営」で飽和点にまでたどり着いた全社共通のデータ分析レベルを超えていくために、自主的にPythonを用いたデータサイエンス技術の導入を図り、さらにクラウド(ここではAWS)の導入でスケーラビリティの追求をも目指し始めていたというのです。


ということで、今回の記事では「社員全員Excel経営」がいかにして「社員全員データサイエンス経営」へと進化しつつあるかについての解説を試みると共に、何故ワークマン社ほどデータ活用が全社的に普及した企業であっても「データサイエンス経営」に行き着くのかという理由について、個人的に考えていることを論じてみようと思います。なお、既にお気付きの方も多いかと思いますがこの記事は「データサイエンスは企業経営に大事ですよ」という僕のポジショントークですので、そこは割り引いてお読みください(笑)。

続きを読む

『標準ベイズ統計学』はベイズ統計学をきちんと基礎から日本語で学びたいという人にとって必携の一冊

発刊当時に話題になっていた『標準ベイズ統計学』。実は訳者のお一人、菅澤翔之助さんからオフィス宛てでご恵贈いただいていたのですが、親父の没後処理やら自分のDVTやら実家の片付けやらで全く手が回らずオフィスに置いたままにしてしまっていたのでした。で、この度改めて拝読してみたら「何故もっと早く読まなかったんだ」と後悔するくらいあまりにも内容が素晴らしかったので、遅まきながら書評記事を書こうと思い立った次第です。


ベイズ統計学というと、殆ど詳しくない人だと「ベイズの定理以外に何があるの?」という印象ぐらいしかないかもしれませんし、一方でとりあえず技法としてやり方だけ覚えてしまった人だと「とりあえずMCMC回せばいいんだよね?」みたいな雑な理解になってしまうかもしれません。いずれにせよこれまで邦書ではベイズ統計学というと超初歩か実装重視かの二択が多かったせいか、「ゼロベースからきちんと学べる」良書に乏しかったという感がありました。


そこに満を持して登場したのが本書です。訳者まえがきにも「ベイズ統計学を学ぶにあたり重要なことは、その考え方の理解と計算アルゴリズムの実装」と謳われている通りで、ベイズ統計学に欠かせない概念である「信念」及びその表現である事前確率と事後確率の意味であったり、はたまた事後確率分布を得るための手法であるモンテカルロ近似・MCMCについての解説がこれでもかと懇切丁寧に綴られており、半可通だった僕にとっては「ああこれがベイズ統計学というものだったのか……」と唸らされること頻りでした。


ということで、早速本書の内容を簡単に紹介していこうと思います。なお、本書では随所で頻度主義統計学との対比がなされているため、古典的な頻度論を既に学んでいることが大前提だと思った方が良いです。少なくとも東大出版会赤本&青本ぐらいは読んでおくべきかもしれません。

続きを読む

データサイエンティストという職業の10年間の変遷を振り返る


(Image by Gordon Johnson from Pixabay)

TL;DR 今年の6月に僕自身がデータサイエンティストに転じて10年という節目の年を迎え、10月でDavenportの「データサイエンティストは21世紀で最もセクシーな職業である」HBR総説から10周年になるのを機に、この10年間のデータサイエンティストという職業の変遷を振り返ることにしました。


6月の回顧録記事でも書いた通り、僕がデータサイエンティストの仕事に就いてから今年で10年になります。最近も同じかどうかは分かりませんが、古くから「10年ひと昔」という常套句がある通りで個人的には大きな節目の年だと感じています。

一方で、今年の10月にはあまりにも有名な「データサイエンティストは21世紀で最もセクシーな職業である」HBR総説が出てから10周年を迎え、後述するようにDavenportは「今もデータサイエンティストは21世紀で最もセクシーな職業か?」という総説を寄稿していたりします。


ということで、6月の回顧録記事ではデータ分析業界全体の10年分(正確には前半5年分にさらに後半5年分)の振り返りを書きましたが、今回は改めて「データサイエンティストという職業」の10年間の変遷を振り返ってみようと思います。とは言え、どちらかというとこの10年の間にこのブログで何度か書いたデータサイエンティストのキャリア論記事の振り返りに終始する感じになっているので、以前からこのブログをご愛読いただいている方々には「もう読み飽きたよ」という内容かもしれませんが、平にご容赦いただければと思います。


(※なおこの記事自体は公開後も何度か加筆修正されていますので、出来れば毎回最新版の内容をチェックしてくださると有難いです)

続きを読む