渋谷駅前で働くデータサイエンティストのブログ

元祖「六本木で働くデータサイエンティスト」です / 道玄坂→銀座→東京→六本木→渋谷駅前

「統計モデリングとは何なのか」をいま一度整理してみる

もうタイトルを読んで字の如しなんですが、要は「統計モデリングってぶっちゃけ何なのよ?」という問題意識が最近非常に局所的ながら影響力の大きいところ*1から出てきておりまして。


で、僕もその議論にマターリ参加しながら「このもやもやしたものをどうやったらうまく表現できるかなー」と思っていて、何日かして自分なりにちょっと整理がついた気がするので、自分向けの備忘録も兼ねてちょっとブログにまとめてみることにしました。ちなみに@さんは既にこの議論についてまとめていらっしゃるようで。


そうそう、今回もお題はこちらの久保先生の緑本です。というかここから議論が始まったわけで。

今や参加者100名を超えるという巨大読書会までもが催されるという大人気の一冊になっているようで。。。これからはBUGSとか階層ベイズとか流行しちゃうんですかね?(笑)

*1:最後の方にそのTwitterでのやり取り載せておきました

続きを読む

Stanで統計モデリングを学ぶ(5): とりあえず階層ベイズモデルを試してみる(応用編:トレンドのあるモデル) *追記2件あり

このシリーズ記事、全然真面目に事前分布の勉強をしていない人間がStanで無理やりフルベイズをやろうという無謀な代物でございますが、何だかんだで段々佳境に入ってまいりました。


ということで、今回は階層ベイズモデルをこんな感じでやってみましたという例を挙げてみようかと思います。ちなみに内容的には@さんのこちらの記事(「RStanで『予測にいかす統計モデリングの基本』の売上データの分析をトレースしてみた」)をグレードダウンさせた感じのものだったりします(笑)。そして先日招待講演させていただいた時の最後の方で取り上げた例でもあります。


そんなわけで、どのようにしてやっていったかを含めてサクサク見ていきましょう。階層ベイズについて忘れちゃったという人は、前回の記事あたりを読んで復習してもらえれば。

続きを読む

Stanで統計モデリングを学ぶ(4): とりあえず階層ベイズモデルを試してみる(基本編)

だいぶ間が空いちゃいましたね(汗)。これまでの記事で大体Stanで何ができるか分かったので、ぼちぼちStanらしいことをやってみようと思います。一応過去記事のリスト出しておきますので、良かったら復習も兼ねてお読みください。


Stanらしいことをやってみようと言っても、美味しいところはとっくの昔に@さんが持って行ってしまわれているので、僕は延々とチマチマ基本的なところを自分の理解のスピードの範囲でやっていくつもりです。


ということで、今回はGLMMのベイズ化という久保先生の緑本と同じテーマでやってみようかと思います。ついでなので、データも久保先生の緑本のサンプルから完全に拝借してしまいますw 今回は第7章のデータに対して、第10章の内容でやっていきます。



もっと言ってしまうと、これって思いっきりITO Hirokiさんのブログで既にやられているネタなので、ぶっちゃけ全く新鮮味はありません(泣)。


ただしITOさんのStanコードはわずかに久保先生のBUGSコードと整合していないので、僕の手元でちょっと試行錯誤してできるだけBUGSコード側に整合させてみたものを紹介しておきます。

続きを読む