見た目は全く同じ実験結果なのに、データの取られ方次第で分析結果が変わる統計的仮説検定

統計学ベイズ統計学

各種SNSでたまに統計哲学まわりの議論が出ると必ず話題に上るのが「尤度原理」即ち「尤度（ある結果が生じる確率をモデルのパラメータの関数と見たもので「データがもたらす」ものでもある）が同じ（もしくは関数形が同じで互いに比例関係にあるだけ）である…

2025-11-12

PyMC Marketing MMM：オーソドックスな実装のベイジアンMMMライブラリ

MMM 統計学ベイズ統計学 Python

だいぶ食傷気味の方も多いかもしれませんが、懲りずに今回もMMM (Marketing/Media Mix Modeling)ネタをやります。この度取り上げるのはこちらです。そう、PyMC Marketing MMMです。あくまでも僕の観測範囲ですが、広く普及しているPyMCベースなのもあってか…

2025-10-06

MMMライブラリ "Meridian" の使い方・特徴・注意点まとめ

MMM 統計学統計的因果推論時系列分析 Python マーケティングビジネス

麗々しく自社プロダクトについてのまとめ記事を書くのは若干気が引けるのですが、先日Gemini 2.5 Proにvibe codingということでMMMのサンプルコードを書かせてみたら既にsunset済みのLigthweight MMMを使ったコードが返ってきた上に、よりにもよってこのブロ…

2025-09-10

回帰分析における多重共線性への対処法リスト

統計学ベイズ統計学

ちょっと前に、回帰分析における多重共線性に関する解説記事を2本ほど書いたわけですが。多重共線性そのものの問題点はこれでもかと論じている割に、その対処法についてはあまり触れていなかったなと気付いたのでした。ということで、今回の記事では遅れば…

2025-06-11

一般化加法モデル(GAM)のknotsはどう決めるべきか

統計学 R

この記事は、以前MMM (Media/Marketing Mix Modeling)について概説した記事の続きです。今年ローンチされたMMMフレームワークのMeridianでは、従来の様々なMMMフレームワークとは異なり、トレンド・季節調整をモデリングする際に一般化加法モデル(Generalize…

2025-05-22

交差検証さえしていれば事足りると思って、多重共線性をスルーしてはいけない

統計学マーケティング R

某所でボソッと呟いたら結構反応があったので、折角なので小ネタながら記事として書いてみようと思います。「多重共線性を放置したまま交差検証して汎化性能が確保できたつもりになる」ことの危険性、ブログにまとめたら需要あるんだろうか https://t.co/Dka…

2025-03-17

深刻な不具合のあるデータ分析は、大抵の場合データも実装コードも見るまでもなくそれと分かってしまう

データ分析ビジネス統計学機械学習

しばらく前に、こんなことを嘯いたら思いの外反応が伸びたのでした。「データも見られなければ統計的学習モデルのアルゴリズムも実装コードも見られない」状況で、そのデータ分析のどこにどんな不具合があるかを「分析結果だけを見る」ことで言い当てるのっ…

2025-02-26

2025年版：独断と偏見で選ぶ、データ分析職の方々にお薦めしたい定番の書籍リスト

書籍書評統計学統計的因果推論機械学習ベイズ統計学 Deep Learning データサイエンス時系列分析

気付いたらこの企画をやるようになってもう12年も経つわけですが、今年も懲りずに推薦書籍リストを書いてみようかと思います。昨年との差異ですが、まず「ホットトピックス」枠を削りました。理由は単純で、データサイエンス分野も昨今の多種多様な分野に細…

2025-01-29

MMMのはなし

統計学統計的因果推論マーケティングベイズ統計学ビジネス MMM

広告・マーケティング分析におけるMMM (Media/Marketing Mix Models)と言えば、このブログでも過去に何度か手を替え品を替え取り上げてきたテーマです。これまでは個々の技術的側面に着目した断片的な内容の記事を多く上げてきましたが、近年明らかにその注…

2025-01-13

多重共線性のはなし

統計学データ分析ビジネス R

どうも昨年末にあちこちで多重共線性についての議論がなされていたようなんですが、些事にかまけていた僕はすっかりそのウェーブに乗り損ねてしまっていたのでした。そこで、今年最初の記事では遅ればせながらそのウェーブに乗る形で、また今までに学んだり…

2024-12-26

自己回帰型モデルによる事前学習スキームの限界と、ビジネス実務の場で見える現実と

年末回顧 LLM 生成AI ビジネスデータ分析マーケティング統計学

早いもので、2024年も恒例の年末回顧記事を書く時期になりました。ということで、今回は一年を通じて話題に事欠かなかった生成AIに関する最近の論争と、一方でBtoBのビジネスの現場で感じている現実とを綴ることで、今年の振り返りといたします。

2024-12-20

ビジネス実務で「正しいデータ分析」を行うということ

データ分析ビジネス統計学機械学習

一般に、ビジネス実務におけるデータ分析というと、経営者や各種ビジネス部門の責任者といったステークホルダーたちが「ビジネス上の意思決定のためのエビデンス」を得る目的で、往々にして社内外のデータ分析の専門家たちに依頼して実施させるものであるこ…

2024-10-28

欠損値処理に関する備忘録

統計学機械学習データ分析

最近某所で話題になっていたのが「欠損値処理はどうやるべきか」というテーマ。これは太古の昔から「荒れるテーマ」として有名で、今回も大いに荒れていて傍観している側としては面白かったんですが（笑）、古老ともあろう身がただ面白がっているだけでは自…

2024-10-02

「見せかけの回帰」の復習

時系列分析統計学マーケティングビジネス

先日のことですが、Querie.meでこんな質疑がありました。これは非常にご尤もなご意見であり、実際この問題提起に近いシチュエーションを見かけたことは五本の指では数え切れないくらいあります。ということで、今回の記事では元々の問題意識ともいえる「見せ…

2024-08-30

AIや機械学習が持て囃されて、統計分析やデータ可視化がいまいち主流になれない理由

AI・人工知能統計学機械学習データ分析ビジネス

先日のことですが、こんなことを放言したら思いの外伸びてしまいました。データ可視化は一時期物凄く流行った割に今はパッとしない印象があるんだけど、それは結局のところデータ可視化が「見る人に『考えさせる』仕組み」だからだと思う。現実の世の中では…

2024-08-13

『ベイズデータ解析』はベイズ統計学を用いる全ての実務家が座右に置くべき第一級の鈍器

書評書籍統計学ベイズ統計学 BUGS/Stan

ベイズデータ解析(第3版)森北出版Amazon先日のことですが、『ベイズデータ解析』を訳者のお一人菅澤さんからご恵贈いただきました。もう一目見ただけで「鈍器」以外の語が出てこないくらいの立派な鈍器で（笑）、原著のBDA3*1に負けないくらいの鈍器っぷりが…

2024-07-20

実務において回帰分析を行うに当たっての注意点を改めて挙げてみる

統計学統計的因果推論マーケティングビジネス

先日のことですが、以下のニュースが統計的学習モデル界隈で話題になっていました。肝心の箇所が会員限定コンテンツなので簡潔にまとめると、従来モデルよりも説明変数に入れる海域の数を増やした上で、Lasso（L1正則化）回帰で多重共線性を抑えつつ汎化性能…

2024-06-17

機械学習を使うデータサイエンスの仕事に比して、統計学を使うデータサイエンスの仕事が産業界に少ない理由

統計学ビジネス人材

近年のデータサイエンティスト界隈では、僕が以前スキル要件記事でも提唱した通りの「ソフトウェアエンジニアの延長としての機械学習エンジニア」（機械学習メイン）と「アナリストの延長としてのデータサイエンティスト」（統計学メイン）とにキャリアもポ…

2024-05-02

過学習（過剰適合）のはなし

機械学習統計学マーケティングビジネス

すっかりおじさんになってしまった身としては近年の日本のミュージックシーンに極めて疎くなって久しいのですが、最近になってAdoさん*1の楽曲に『過学習』というタイトルのものがあるということを知ったのでした。一体どこで「過学習」なんてマニアックなテ…

2024-04-22

『因果推論』（金本拓：オーム社）は因果推論に留まらず現代的なマーケティング分析手法まで網羅したバイブル

書評統計学統計的因果推論マーケティング Python 機械学習

因果推論: 基礎から機械学習・時系列解析・因果探索を用いた意思決定のアプローチ作者:金本拓オーム社Amazon著者の金本さんからご指名でご恵贈いただいたのが、こちらの『因果推論 ―基礎から機械学習・時系列解析・因果探索を用いた意思決定のアプローチ―』…

2024-03-18

どのような場面で多重比較補正が必要なのか

統計学再現性問題 R

先日のことですが、Querie*1で以下のような質疑がありました。恐らくですが、これは僕が懇意にさせていただいているマクリン謙一郎さんがコメントしていた件に関連する話題だと思われます。たしかにこれではないからHARKingとはちょっと違うと思うんだけど、…

2024-02-28

ビジネスの実務で「因果」を推測するということ

マーケティング統計学統計的因果推論時系列分析

統計的因果推論と言えばすっかり統計学分野ではお馴染みのアプローチになった感があり、また機械学習分野でも扱うテーマが複雑化するにつれて注目が高まり続けているトピックスという印象があります。このブログでも2016年ぐらいから因果推論に関する記事を…

2024-02-23

2024年版：独断と偏見で選ぶ、データ分析職の方々にお薦めしたいホットトピックス＆定番の書籍リスト

書籍書評統計学統計的因果推論機械学習 Deep Learning R Python SQL BUGS/Stan graph/network AI・人工知能

毎年四の五の言いながら書いている推薦書籍リスト記事ですが、何だかんだで今年も書くことにしました。なお昨年度版の記事を上にリンクしておきましたので、以前のバージョンを読まれたい方はそちらをお読みください。今回のバージョンでは、趣向をちょっと…

2024-01-22

「入試に数学を課さないデータサイエンス学部」は是か非か

データサイエンス人材機械学習統計学

最近の話ですが、以下のようなニュースが話題になっているのを見かけました。データサイエンス系の学部は文理融合の学びを掲げ、文系の受験生も集めるため、受験科目に「数学」を含まない入試方式を設ける大学も少なくない。河合塾によると、私立大のデータ…

2023-12-04

CausalImpactは実装によって中身に重大な差異がある

統計学統計的因果推論 R Python TensorFlow

CausalImpactについては、過去にこのブログでも何度か話題にしてきたかと思います。端的に言えば、seasonalityによるバイアスを補正するための実験計画であるDID（Difference in Differences：差分の差分法）によって得られたtest/controlグループの時系列デ…

2023-11-11

データセットの本質的な性質を踏まえないデータ分析には、大抵何の意味もない

統計学機械学習時系列分析データ分析ビジネスマーケティング

前回のブログ記事は、論文紹介という地味なテーマだったにしてはだいぶ話題を呼んだ*1ようで、個人的にはちょっと意外な感があったのでした。確かに、今をときめくTransformerにも苦手なものがあるという指摘は、NN一強の現代にあってはセンセーショナルなも…

2023-10-21

「機械学習で時系列予測はできるのか」論議がTransformerと共に帰ってきた

時系列分析機械学習 Deep Learning 統計学論文研究

先日、こちらのポストをお見かけしました。AI技術開発部の高橋が社内勉強会の資料「時系列予測にTransformerを使うのは有効か？」を公開しました。論文Are Transformers Effective for Time Series Forecastingの紹介を中心に、時系列予測について解説してい…

2023-09-18

MMM (Media/Marketing Mix Modeling)を回すなら、まずGeorge E. P. Boxの格言を思い出そう

統計学マーケティングビジネス統計的因果推論

「最後の統計学界の大御所」の一人で、2013年に亡くなったGeorge E. P. Box*1が残した格言 "All models are wrong; but some are useful"（全てのモデルは間違っている、だが中には役立つものもある）ですが、このブログでは過去に何度も紹介しているのでお…

2023-06-09

シュートを外した後で、ゴールポストを動かして「入っていた」ということにしてはいけない

統計学再現性問題

先日こんなことをコメントしたら、思ったよりも反応が多くて「皆さん同じことを思っていたのかな」と感じたのでした。シュートを外した後でゴールポストを動かして入ったことにするのはダメですよ / 「当初は有意差が認められなかったが、毛乳頭細胞が少ない…

2023-04-26

マーケティングデータ分析で成果を挙げるには「統計分析（MMMなど）＋A/Bテスト」のコンビネーションが有用

データ分析マーケティングビジネス統計学

既に記事タイトルが雄弁に物語っていますが、「マーケティング分野におけるデータ分析でいかにして成果を挙げるか」というのはある意味永遠の課題であると言えると思います。誇張でも何でもなく、この地球上の全てのマーケティングに関わるデータ分析組織で…

渋谷駅前で働くデータサイエンティストのブログ

元祖「六本木で働くデータサイエンティスト」です / 道玄坂→銀座→東京→六本木→渋谷駅前

統計学