六本木で働くデータサイエンティストのブログ

元祖「銀座で働くデータサイエンティスト」です / 道玄坂→銀座→東京→六本木

偏Granger因果で「第三者効果」を排除しつつ因果性検定してみる

遥か古の時代、まだ自分が研究者だった頃にデータ分析に使っていた手法のひとつに偏Granger因果 (partial Granger causality) というものがありました。これはGuo et al. (2008)で提唱されたもので、当時は著者グループ提供のオリジナルMatlabツールボックスを使っていたのですが、仕事も変わりRやPythonをメインに使うようになってからは触る機会は全くなくなっていたのでした。


ところが、先日偶然その偏Granger因果について触れる機会があったので、もしかしてと思ってググってみたらR実装があることに気付きました。こちらの{FIAR}パッケージです。

とりあえずちょっと触ってみた感じでは、当時のMatlabツールボックスよりもGUIという面では弱いものの、一方でMatlabツールボックスでは未整備でユーザーが自分で書かなきゃいけなかったようなところは逆に整備されているということで、一旦は実用に耐えそうだという印象です。


ということで、今回の記事では偏Granger因果について説明しつつ、その{FIAR}パッケージを用いた実践方法について簡単に紹介してみることにします。なお、ここでは自分で延々とTeXで式を書くのは極めてだるい(どれも割と冗長な表現がされていて式の長さの割に大したことは言ってない)ので、個々の式に関しては最小限TeXで書くに留め、代わりに参考文献・資料へのポインタを示しておきます。詳しい数式展開が見たいという方はそれらをご自分でご覧ください。

続きを読む

Ads carryover & shape effects付きのMedia Mix Modeling

これは単なる備忘録です。「論文とサンプルコード読みながら試しました」以外に何も内容のない記事ですのでご注意ください。特に個々の式の変数の説明については個人的な備忘録ゆえ大半を端折りますので、仮に興味を持たれた方は適宜論文の本文をご参照下さい。読んだ論文はこちら。

なお、この記事を書くに当たってid:ushi-goroshiさんのこちらのブログ記事シリーズを参考にさせていただきました。分かりやすくて大変助かりました、有難うございます。

それでは適当にやっていきます。

続きを読む

データサイエンティストや機械学習エンジニアに求められる「素質」とは何か

f:id:TJO:20180822221813p:plain
(Image by Pixabay)

某所で時々意見交換させていただいている@さんが、面白い記事をnoteにupなさっていたので拝読しました。細かい内容は上記のリンク先から皆さんに直接お読みいただくとして、記事中で某所で僕が放言(笑)したことへのご質問をいただいていたのでした。それは、データサイエンティストや機械学習エンジニアといったデータ分析人材に求められる「素質」について、です。

それは例えば統計学機械学習はたまたプログラミングといった「スキル」や「素養」とも違う、言ってみれば性格的傾向とか仕事スタイルとかはたまた思想信条のような、もうちょっと属人的で曖昧なものだと思うのですが、個人的な経験からはその「素質」の有無がデータ分析職として育成した結果、ものになるかならないかを分けるように感じられています。


ということで、あくまでも個人的経験に基づく範囲でデータサイエンティストや機械学習エンジニアをゼロから育成する際に、事前に求められる「素質」とは何かという点について簡単に論じてみようと思います。はい、今回も与太記事です(笑)。業界事情ネタなので、情報源の秘匿も含めてデータは基本的には開示できませんというか、そもそも定量的データとしてまとまることのない性質のお話ですので、その点はご容赦を。なお、いつものdisclaimerで恐縮ですが、ここで論じられている内容はいかなる組織や機関のいかなる実例とも一切関係ありませんので、どうか悪しからずご了承ください。

  • 「素質」は大別すると3種類ある
    • データドリブンなメンタリティ
    • データ分析を支える学術・技術への学習意欲
    • 旺盛かつ根源的な知的好奇心
  • 身も蓋もないまとめ
続きを読む