渋谷駅前で働くデータサイエンティストのブログ

元祖「六本木で働くデータサイエンティスト」です / 道玄坂→銀座→東京→六本木→渋谷駅前

2024年版:独断と偏見で選ぶ、データ分析職の方々にお薦めしたいホットトピックス&定番の書籍リスト

毎年四の五の言いながら書いている推薦書籍リスト記事ですが、何だかんだで今年も書くことにしました。なお昨年度版の記事を上にリンクしておきましたので、以前のバージョンを読まれたい方はそちらをお読みください。


今回のバージョンでは、趣向をちょっと変えて「定番」と「注目分野」というように分けました。何故こうしたかというと、平たく言って

  • 「初級&中級向け」推薦書籍リストは定番化していて毎年あまり変更点がない
  • 逆に直近のホットトピックスに関するテキストは毎年入れ替わりが激し過ぎて網羅しづらい

という課題があり、特に2点目についてはあまりにもデータサイエンス関連書籍の新規刊行が多過ぎる&僕自身がその流れについていけておらず完全に浦島太郎状態ですので、万人向けに等しくウケるようなリストを作るのは今回をもって完全に諦めたというのが実態です。


その上で、前回まで踏襲されていた定番書籍リストはバルクで提示すると同時に、あくまでも僕の独断と偏見で直近1年間のホットトピックスに沿った知識・見識を提供してくれるであろう注目書籍をピックアップしたリストを提示する、というスタイルを取ることとしました。

続きを読む

『標準ベイズ統計学』はベイズ統計学をきちんと基礎から日本語で学びたいという人にとって必携の一冊

発刊当時に話題になっていた『標準ベイズ統計学』。実は訳者のお一人、菅澤翔之助さんからオフィス宛てでご恵贈いただいていたのですが、親父の没後処理やら自分のDVTやら実家の片付けやらで全く手が回らずオフィスに置いたままにしてしまっていたのでした。で、この度改めて拝読してみたら「何故もっと早く読まなかったんだ」と後悔するくらいあまりにも内容が素晴らしかったので、遅まきながら書評記事を書こうと思い立った次第です。


ベイズ統計学というと、殆ど詳しくない人だと「ベイズの定理以外に何があるの?」という印象ぐらいしかないかもしれませんし、一方でとりあえず技法としてやり方だけ覚えてしまった人だと「とりあえずMCMC回せばいいんだよね?」みたいな雑な理解になってしまうかもしれません。いずれにせよこれまで邦書ではベイズ統計学というと超初歩か実装重視かの二択が多かったせいか、「ゼロベースからきちんと学べる」良書に乏しかったという感がありました。


そこに満を持して登場したのが本書です。訳者まえがきにも「ベイズ統計学を学ぶにあたり重要なことは、その考え方の理解と計算アルゴリズムの実装」と謳われている通りで、ベイズ統計学に欠かせない概念である「信念」及びその表現である事前確率と事後確率の意味であったり、はたまた事後確率分布を得るための手法であるモンテカルロ近似・MCMCについての解説がこれでもかと懇切丁寧に綴られており、半可通だった僕にとっては「ああこれがベイズ統計学というものだったのか……」と唸らされること頻りでした。


ということで、早速本書の内容を簡単に紹介していこうと思います。なお、本書では随所で頻度主義統計学との対比がなされているため、古典的な頻度論を既に学んでいることが大前提だと思った方が良いです。少なくとも東大出版会赤本&青本ぐらいは読んでおくべきかもしれません。

続きを読む

今更ながら自分でRパッケージを作ってみた(RStan連携も含めて)

f:id:TJO:20210331153629p:plain

元はと言えばアホなエイプリルフールネタを作るために勉強し始めたことなのですが、折角だしということで毎日15時過ぎにやっている「本日の東京都のCOVID-19陽性報告数を踏まえた感染拡大状況把握のためのフィッティング」ネタをRパッケージにまとめて簡単に出来るようにしたのでした。が、そのプロセスが結構落とし穴が多くて大変だったので、後々の自分のための備忘録として書き残しておくことにします。

続きを読む