過学習（過剰適合）のはなし

機械学習統計学マーケティングビジネス

すっかりおじさんになってしまった身としては近年の日本のミュージックシーンに極めて疎くなって久しいのですが、最近になってAdoさん*1の楽曲に『過学習』というタイトルのものがあるということを知ったのでした。一体どこで「過学習」なんてマニアックなテ…

2024-04-22

『因果推論』（金本拓：オーム社）は因果推論に留まらず現代的なマーケティング分析手法まで網羅したバイブル

書評統計学統計的因果推論マーケティング Python 機械学習

因果推論: 基礎から機械学習・時系列解析・因果探索を用いた意思決定のアプローチ作者:金本拓オーム社Amazon著者の金本さんからご指名でご恵贈いただいたのが、こちらの『因果推論 ―基礎から機械学習・時系列解析・因果探索を用いた意思決定のアプローチ―』…

2024-03-18

どのような場面で多重比較補正が必要なのか

統計学再現性問題 R

先日のことですが、Querie*1で以下のような質疑がありました。恐らくですが、これは僕が懇意にさせていただいているマクリン謙一郎さんがコメントしていた件に関連する話題だと思われます。たしかにこれではないからHARKingとはちょっと違うと思うんだけど、…

2024-02-28

ビジネスの実務で「因果」を推測するということ

マーケティング統計学統計的因果推論時系列分析

統計的因果推論と言えばすっかり統計学分野ではお馴染みのアプローチになった感があり、また機械学習分野でも扱うテーマが複雑化するにつれて注目が高まり続けているトピックスという印象があります。このブログでも2016年ぐらいから因果推論に関する記事を…

2024-02-23

2024年版：独断と偏見で選ぶ、データ分析職の方々にお薦めしたいホットトピックス＆定番の書籍リスト

書籍書評統計学統計的因果推論機械学習 Deep Learning R Python SQL BUGS/Stan graph/network AI・人工知能

毎年四の五の言いながら書いている推薦書籍リスト記事ですが、何だかんだで今年も書くことにしました。なお昨年度版の記事を上にリンクしておきましたので、以前のバージョンを読まれたい方はそちらをお読みください。今回のバージョンでは、趣向をちょっと…

2024-01-22

「入試に数学を課さないデータサイエンス学部」は是か非か

データサイエンス人材機械学習統計学

最近の話ですが、以下のようなニュースが話題になっているのを見かけました。データサイエンス系の学部は文理融合の学びを掲げ、文系の受験生も集めるため、受験科目に「数学」を含まない入試方式を設ける大学も少なくない。河合塾によると、私立大のデータ…

2023-12-04

CausalImpactは実装によって中身に重大な差異がある

統計学統計的因果推論 R Python TensorFlow

CausalImpactについては、過去にこのブログでも何度か話題にしてきたかと思います。端的に言えば、seasonalityによるバイアスを補正するための実験計画であるDID（Difference in Differences：差分の差分法）によって得られたtest/controlグループの時系列デ…

2023-11-11

データセットの本質的な性質を踏まえないデータ分析には、大抵何の意味もない

統計学機械学習時系列分析データ分析ビジネスマーケティング

前回のブログ記事は、論文紹介という地味なテーマだったにしてはだいぶ話題を呼んだ*1ようで、個人的にはちょっと意外な感があったのでした。確かに、今をときめくTransformerにも苦手なものがあるという指摘は、NN一強の現代にあってはセンセーショナルなも…

2023-10-21

「機械学習で時系列予測はできるのか」論議がTransformerと共に帰ってきた

時系列分析機械学習 Deep Learning 統計学論文研究

先日、こちらのポストをお見かけしました。AI技術開発部の高橋が社内勉強会の資料「時系列予測にTransformerを使うのは有効か？」を公開しました。論文Are Transformers Effective for Time Series Forecastingの紹介を中心に、時系列予測について解説してい…

2023-09-18

MMM (Media/Marketing Mix Modeling)を回すなら、まずGeorge E. P. Boxの格言を思い出そう

統計学マーケティングビジネス統計的因果推論

「最後の統計学界の大御所」の一人で、2013年に亡くなったGeorge E. P. Box*1が残した格言 "All models are wrong; but some are useful"（全てのモデルは間違っている、だが中には役立つものもある）ですが、このブログでは過去に何度も紹介しているのでお…

2023-06-09

シュートを外した後で、ゴールポストを動かして「入っていた」ということにしてはいけない

統計学再現性問題

先日こんなことをコメントしたら、思ったよりも反応が多くて「皆さん同じことを思っていたのかな」と感じたのでした。シュートを外した後でゴールポストを動かして入ったことにするのはダメですよ / 「当初は有意差が認められなかったが、毛乳頭細胞が少ない…

2023-04-26

マーケティングデータ分析で成果を挙げるには「統計分析（MMMなど）＋A/Bテスト」のコンビネーションが有用

データ分析マーケティングビジネス統計学

既に記事タイトルが雄弁に物語っていますが、「マーケティング分野におけるデータ分析でいかにして成果を挙げるか」というのはある意味永遠の課題であると言えると思います。誇張でも何でもなく、この地球上の全てのマーケティングに関わるデータ分析組織で…

2023-04-01

ChatGPTに書かせた基礎統計学の教科書を公開しました

AI・人工知能統計学書籍エイプリルフール LLM

ChatGPT以下各種LLM chatbotが創り出すコンテンツが何かと話題を呼ぶ昨今ですが、僕もその世間の潮流に沿って試してみたことがあります。それが「統計学の教科書の自動執筆」です。ということで、実際にChatGPTを使って基礎統計学の教科書を書いてみました…

2023-02-07

2023年版：実務データ分析を手掛けるデータサイエンティスト向け推薦書籍リスト（初級6冊＋中級8冊＋テーマ別15冊）

書籍書評統計学機械学習データサイエンティスト R Python

(Image by wal_172619 from Pixabay)去年で恒例の推薦書籍リストの更新は一旦終了したつもりだったんですが、記事を公開して以降に「これは新たにリスト入りさせないわけにはいかない！」という書籍が幾つも現れる事態になりましたので、前言撤回して今年も…

2022-11-21

『標準ベイズ統計学』はベイズ統計学をきちんと基礎から日本語で学びたいという人にとって必携の一冊

書評書籍統計学 BUGS/Stan MCMC

標準ベイズ統計学朝倉書店Amazon発刊当時に話題になっていた『標準ベイズ統計学』。実は訳者のお一人、菅澤翔之助さんからオフィス宛てでご恵贈いただいていたのですが、親父の没後処理やら自分のDVTやら実家の片付けやらで全く手が回らずオフィスに置いた…

2022-09-15

Lightweight MMM：NumPyroで実装されたベイジアンMMMフレームワーク

Python 統計学マーケティング MCMC

以前「Ads carryover & shape effects付きのMedia Mix Modeling」という記事で取り上げたベイジアンMMMのtechnical report (Jin et al., 2017)ですが、当時RStanで実装されていたものが4年の時を経て時代の趨勢に沿う形でPythonベースのOSSとしてリリースさ…