渋谷駅前で働くデータサイエンティストのブログ

元祖「六本木で働くデータサイエンティスト」です / 道玄坂→銀座→東京→六本木→渋谷駅前

生TensorFlow七転八倒記(8):YouTubeのコメントデータセットをTF-Hub embeddingで特徴量変換してスパム判定してみる

せっかくの週末にもかかわらず台風が来てしまい、テニスも出来なければ街歩きも出来ず暇を極めることになってしまったので、UCI ML repositoryを眺めていて見つけた適当なデータセットに対してTensorFlowで遊ぶということをしてみました。


基本的にはこのシリーズの前回の記事の続きです。

続きを読む

シンガポールに行ってきました(2年半ぶり5回目)

f:id:TJO:20180923082750p:plain
今回のシンガポールは前半4日間は年休を消化してプライベートの旅行として、後半4日間は会社の出張として行ってきました。ということで、あまり書くこともないので8日間(7泊)に食べたものなどを適当に並べておくことにします。

続きを読む

偏Granger因果で「第三者効果」を排除しつつ因果性検定してみる

遥か古の時代、まだ自分が研究者だった頃にデータ分析に使っていた手法のひとつに偏Granger因果 (partial Granger causality) というものがありました。これはGuo et al. (2008)で提唱されたもので、当時は著者グループ提供のオリジナルMatlabツールボックスを使っていたのですが、仕事も変わりRやPythonをメインに使うようになってからは触る機会は全くなくなっていたのでした。


ところが、先日偶然その偏Granger因果について触れる機会があったので、もしかしてと思ってググってみたらR実装があることに気付きました。こちらの{FIAR}パッケージです。

とりあえずちょっと触ってみた感じでは、当時のMatlabツールボックスよりもGUIという面では弱いものの、一方でMatlabツールボックスでは未整備でユーザーが自分で書かなきゃいけなかったようなところは逆に整備されているということで、一旦は実用に耐えそうだという印象です。


ということで、今回の記事では偏Granger因果について説明しつつ、その{FIAR}パッケージを用いた実践方法について簡単に紹介してみることにします。なお、ここでは自分で延々とTeXで式を書くのは極めてだるい(どれも割と冗長な表現がされていて式の長さの割に大したことは言ってない)ので、個々の式に関しては最小限TeXで書くに留め、代わりに参考文献・資料へのポインタを示しておきます。詳しい数式展開が見たいという方はそれらをご自分でご覧ください。

続きを読む