渋谷駅前で働くデータサイエンティストのブログ

元祖「六本木で働くデータサイエンティスト」です / 道玄坂→銀座→東京→六本木→渋谷駅前

2025年版:独断と偏見で選ぶ、データ分析職の方々にお薦めしたい定番の書籍リスト

気付いたらこの企画をやるようになってもう12年も経つわけですが、今年も懲りずに推薦書籍リストを書いてみようかと思います。


昨年との差異ですが、まず「ホットトピックス」枠を削りました。理由は単純で、データサイエンス分野も昨今の多種多様な分野に細分化されていく一方で、「誰もが追いかけるテーマ」が事実上空前の大ブーム下にある生成AIだけになってしまっているからです。このブログのスタンスとしては「生成AIにまつわる最先端のあれこれは他所様に任せる」という方針なので、生成AIのトレンドを取り上げないとなると必然的にホットトピックスもなくなるということで、今回は定番の書籍リストのみ若干の改訂を加えて記すこととします。


一方で、生成AIが普及してきたこともあって「定番」の書籍リストにも相応の入れ替わりがあります。これまた理由はシンプルで、「この程度の実装やコーディングなら生成AIに聞けば十分」というケースが増えてきたからです(詳細は後述)。そのため、「理論やアルゴリズムの解説はそこそこにコード実装の解説が充実している」系のテキストは今年のリストからは割愛し、「しっかり理論やアルゴリズムを解説している」系のテキストをリストに新たに入れたり戻したりしています。

続きを読む

ビジネス実務で「正しいデータ分析」を行うということ

一般に、ビジネス実務におけるデータ分析というと、経営者や各種ビジネス部門の責任者といったステークホルダーたちが「ビジネス上の意思決定のためのエビデンス」を得る目的で、往々にして社内外のデータ分析の専門家たちに依頼して実施させるものであることが多いかと思います。


そうすると、データ分析業界では太古の昔からの鉄板あるあるネタである「上が〇〇という結果が欲しいと言っているので〇〇という結果になるようにしろ」とか「お客さんが〇〇は経営判断に必要なので分析結果に入れろと言っているから〇〇だけは外さないでくれ」というような、統計学機械学習の「外側」にある事情が分析プロセスに割り込んでくるという事態が、ほぼ常につきまといます。


で、そういった事態にどう対処するかは、僕個人の観測範囲ではデータ分析業界の中でも割と幅広くやり方が分かれるように見えます。「毅然として断る」という人もいれば、「仕事である以上仕方ないので受け入れる」という人もいて、さらにそのスペクトラムまで入れるとデータ分析者の数だけバリエーションがあると言っても過言ではなさそうです。


そこで、ここ数年僕自身がビジネス実務向けのデータ分析(主に統計分析:もっと言えばMMM)を手掛ける中で気づいたことを中心にまとめながら、そういったビジネス実務の現実の中でどのようにして「正しいデータ分析」をやっていくか、そして何故そうするべきかという点について論じてみようと思います。

続きを読む

LLMには"Super Weights"があるという話と、現実のヒトの脳との関連性を考えてみる

X (Twitter)を眺めていたら、面白そうな論文が流れてきました。それがこちらです。

実際に流れてきたのはこちらの紹介記事なんですが、その要約を読んだ限りでもなかなかに興味深い現象であるように思われます。

ということで、何番煎じかもはや分かりませんがこのブログでも備忘録的に取り上げてみようと思います。が、ただそれだけでは面白くないので、この論文を読んで僕が個人的に考えた「現実のヒトの脳との関連性」についても論じてみることにします。

続きを読む