渋谷駅前で働くデータサイエンティストのブログ

元祖「六本木で働くデータサイエンティスト」です / 道玄坂→銀座→東京→六本木→渋谷駅前

『計量経済学』(末石本)はエコノメトリクスのエッセンスを「オールインクルーシブ」で簡潔にまとめた必読の一冊

データ分析業界の友人から「読んでみたら物凄く良かった」と勧められて買ったのが、こちらの一冊。同名の書籍は沢山あるので、ここでは著者の末石先生のお名前を取って「末石本」と呼ばせていただきますが、これが本当に物凄く良くて感嘆させられるばかりでした。


ということで、門外漢が書いて良いものかどうか迷うところですが簡単に書評をまとめてみました。特に操作変数法を中心とする因果推論・自然実験まわりの確かな知識を得たい人にはお薦めだということを最初に書き添えておきます。なお、いつもながらですが僕の理解があやふやなため書評の中には怪しい箇所もあるかと思いますので、お気付きの方はコメント欄なりでご指摘くださると幸いです。

本書の内容


いつも通り、簡潔に本書の内容をざっくりまとめてご紹介しておきます。「はしがき」にも書かれている通り、本書はミクロ計量経済学分野の話題に絞って書かれており、さらに内生性・サンプルセレクションバイアスといった「数理統計学の外側にあるが社会科学には固有の問題」にフォーカスを当てている点が特徴的です。

第1章 線形回帰とOLS

ごくごく初歩的な線形回帰とOLSの話題で、以前絶賛した佐和本でも既出のポイントが多いです。ただ、計量経済学の本らしく漸近理論を強く意識して推定量の性質などについて論じており、例えば東大出版会赤本・青本緑本などで線形回帰について学んだ人には色々と目から鱗のポイントも多いはずです*1。そしてこの1章だけで佐和本のメイントピックスのほぼ全てが網羅されているという点で、そのコンパクトさと簡潔さがお分かりいただけるかと思います。

第2章 操作変数法

いよいよここから本書の特徴的なパートに入っていきます。操作変数法は、僕個人としては以前から統計的因果推論を学んできた割にいまいち身についてこなかった感のあるトピックだったので、この第2章は非常に分かりやすかったです。内容としては、まず内生性(外生性)の概念の説明、構造型と識別の説明、2段階最小二乗法(TSLS)、Wald推定量といった標準的なトピックに加えて、2021年度のノーベル経済学賞に輝いたAngristの自然実験を題材とした「操作変数の見つけ方」の話題も盛り込まれていて、門外漢には有難い限りです。

第3章 プログラム評価

ここでは因果推論の要ともいえる反実仮想フレームワーク*2や無視可能性の概念、さらに2章でも触れられた自然実験と操作変数、加えてLATE(局所的平均処置効果)や回帰不連続デザインといった、鉄板の話題がコンパクトにまとめられています。

第4章 行列表記と漸近理論

この章は各種推定量の性質の話題をしながら、ついでに行列計算と漸近理論にまつわる話題もカバーするという代物です。ライブラリをぽちぽちするだけなら知らなくても良いかもしれませんが、結構重要な仮定の話が色々されているので「ライブラリを使ってもうまくいかない」場合に備えるという意味では頑張って数式を追って理解した方が良いと思います。

第5章 直交条件とGMM

計量経済学では頻出の一般化モーメント法(GMM)の話題がメインの章です。GMM推定量の解説や関連して経験尤度法の話題などもされています。ちなみに僕個人はGMMは全く勉強したことがなかったので、良い勉強になりました*3

第6章 制限従属変数とサンプルセレクション

ここではサンプルセレクションバイアスがかかることによって、これまでのようなOLS系の回帰では対処できないデータの扱い方が説明されています。まず二値データになる場合の二項回帰を取っ掛かりとして、ある閾値以上のデータが秘匿されるケースで起き得る打ち切り回帰や切断回帰といった話題が解説されています。

第7章 分位点回帰

通常の回帰モデルと違って「分布形状への説明変数の影響を説明したい」時に使われる分位点回帰の話題を取り上げた章です。なお打ち切り分位点回帰として、6章の話題を引き継いだトピックも紹介されています。

第8章 ブートストラップ

時々実験データ分析などでも使われるブートストラップ標本に基づく分析ですが、本書ではこの章でそのアイデアと理論について説明した上で、実際にどのような検定手法が用いられるか・何の推定に使えるかといった話題が解説されています。ちなみに、何を隠そうブートストラップ検定は実は僕が大昔書いた論文でも使っていたことがあり、当時は何も考えずに使ったものですが本書を読んで大変勉強になりました*4

第9章 ノンパラメトリック

最後のこの章では、カーネル密度推定やノンパラメトリック回帰、cross validationの推定量といったトピックスが扱われていて、7章までの雰囲気とはちょっと違うと感じられるかもしれません。どちらかというとベイズ統計や機械学習方面の人たちの方が馴染み深い話題かもと思いました。

付録

ところで、本書の面白いところはこんなに薄い*5のに、巻末に確率・行列計算・最尤法の復習がまとめられている点です。流石にこれ「だけ」読んで勉強して本書の中にズラリと並ぶ数式を読み解くのは無理だと思いますが、大学時代に教養課程レベルの数学を学んだが卒業してから内容を忘れてしまったという人にとっては、非常に分かりやすく良い復習教材だと思います。


個人的に特筆すべきだと感じた点


実は、僕が実際に本書を読んでみて覚えた感想ほぼそのままの内容が既にAmazonレビューに書かれており、わざわざ改めてここで僕が何か感想を書くまでもないと思うのですが、それでも一応以下に感想を並べておきます。


まず「とにかく記述がコンパクトで簡潔」という点。これは他の統計学やエコノメの専門書を読むと分かるかと思いますが、結構冗長な説明を何ページも並べてしまう本って少なくないんですよね。ところが、本書ではそういう冗長な説明は極力排されているようで、必要不可欠な本質を突く説明だけがシンプルに書かれています。最初の方に出てきますが、例えば2.1.2節のTSLSの説明は「2段階」の具体的な内容をリストアップしてから、それを表現する推定量を示して、さらに「OLSとはどこが違うか」が明示されていて、初学者の自分にも分かりやすかったです。


一方で個人的に有難かったのが「適宜実例が用いられていて感覚的に分かりやすい」点。特に自然実験と操作変数に関わるパートは主にAngristの文献に由来する例が細かく引用されながら論じられており、完全に数式だけが並んで概念の話だけをされるよりも格段に取っ付きやすい感があります。また9章のノンパラメトリック法の説明でも、最初に9.1節でパラメトリック推定ではデータの細かい特徴を追い切れないのに対してノンパラメトリック推定で見事に特異な分布形状とその性質を説明してみせたという例を挙げていて、こういう使い方が重要なんだなと最初に直感的に理解させようという姿勢が有難かったです。


最後に、これを数学が大の苦手な僕が書くのは気が引けますが「数学的な厳密さを損なわない姿勢がはっきりしている」点。特に各種の推定量の性質についてはかなり最初の方の章からも手加減なくしっかり論じられていますし、例えば4.2.2節のOLS推定量の性質に関する説明では「均一分散は経済データの分析においては例外的なケース」ということで、均一分散を仮定した(4.7)式ではなく不均一分散でも使える(4.6)式を使うべき、といった解説が丁寧になされているところは、数学が大の苦手な僕にも分かりやすくて実に有難い限りです。


ただ、これだけはお断りしておきますが「本当に大学の教養課程数学の知識が全くない」人が本書を読むのは流石に難しいと思うのでおやめになった方が良いです。というのは、エコノメ系の分厚い本やゴリゴリの論文にありがちな「ページの上から下まで全て難解な数式だけ」みたいな箇所はないですよというだけで、普通に数式を用いた解説がズラリと並んでいる本であることに変わりはないからです。大絶賛しておいて何ですが、この点だけはご留意くださればと思います。


最後に


佐和本の時も起きた問題なんですが、このブログの書評記事がバズると紹介された本がAmazonで売り切れになるor転売屋による価格吊り上げが起きるということが往々にしてありまして(汗)、本書も紙版しかないのでその事態に発展する可能性が懸念されます。ということで、日本評論社さんにおかれましてはぜひぜひ本書の電子書籍化をお願いしたいところです。今後も多くの人たちに読み継がれる名著だと思いますので、どうか前向きにご検討くだされば幸いですm(_ _)m


そして本書の内容もしくは本書で取り上げられているものと同等の内容をそのままコードを書いて試すコンテンツがあったら良いのになぁと思っていたら、調べたところこんなサイト(というか洋書)が見つかりました。内容は当然英語ですが、本書で解説されている個々の概念についてRコードで実装して解説しており、非常に有益なコンテンツだと思います。ただし僕もまだ全部は試していないので、ご利用は皆さんの自己責任でお願いいたします。

*1:というか自分がそうだったわけですががが

*2:ATEやATTの概念の説明もここに入る

*3:理解し切れたとは言っていない

*4:論文に書いた内容が間違っていたかもしれないという恐怖を感じつつorz

*5:200ページちょっと