六本木で働くデータサイエンティストのブログ

元祖「銀座で働くデータサイエンティスト」です / 道玄坂→銀座→東京→六本木

時変係数動的線形モデルをStanで推定してみる(追記あり)

これはただの備忘録です。目新しい内容は特に何もありません。きちんとした内容を学びたいという方は、先日著者の萩原さんからご恵贈いただいたこちらの書籍で学ばれることをお薦めいたします。MCMCに留まらず、粒子フィルタの実装&実践までカバーしていて素晴らしい教科書だと思います。

で、今回取り上げるのは時変係数から成る動的線形モデルです。マーケティング分析では割と時不変係数モデルが暗黙のうちに採用されることが多いのですが、一方で「おいこれどう見ても特定の特徴量の係数は時変やろ」みたいなケースも時々見かけることがあってやろうとは思っていたものの、単にStanでどう書くか考えるのが面倒で放っていたという(笑)。ということで、今回は真面目にやってみようと思います。

続きを読む

「データを集める前にデータ分析責任者(データサイエンティスト)を雇うべき」理由とは

f:id:TJO:20160716180212j:plain
(Image by Pixabay)

先日こんな記事が注目を集めていたのを見かけたのでした。

ここで大事なのは、データ集めは非常に大事なステップですが、最初の0.8歩に過ぎないということです。データ解析やAI技術導入の準備に時間をかけすぎていて、「やっとビッグデータが溜まった」と思ったときにデータサイエンティストに大量のデータを丸投げする、というプロセスは非効率的なのです。


それよりも、最初の段階からデータサイエンティストを交えて、ゴールを志向しながら逆算的アプローチでデータを収集、解析した方が良い結果が確実に出ます。

これはもう、日本のデータ分析業界で色々な現場の話を見聞してきた日本で働くデータサイエンティストの身としては、耳が痛いを通り越して耳から血を噴きそうな話です。にもかかわらず、こういう話をデータ分析業界「以外」の人たちに話してもなかなかピンと来ない人が多いのか「?」という顔をされがちなのが現状です。


ということで最近与太記事が続いていて恐縮なのですが、今回も「何故データを集める前にデータサイエンティストを雇うべきなのか」という与太記事を書いてみようと思います。

続きを読む

機械学習をやる上で必要な数学とは、どの分野のどのレベルの話なのか(数学が大の苦手な人間バージョン)

しばらく前にこんな記事が出ていたのをお見かけしました。

明らかにこれは僕が某所(笑)で適当に放言したことがきっかけで巻き起こった議論の一旦なのではないかと思うのですが、個人的にはこちらの@さんの仰る通りで大体良いのではないかと考えております。


なのですが、言い出しっぺらしき身としてはもうちょっと何か具体的な話を書いた方が良いのかな?とも思いましたので、常々公言しているように数学が大の苦手な身ながらどの分野のどのレベルの数学が機械学習をやっていく上で必要なのかという点について戯言だらけの駄文を書いてみることにします。


深層学習 (機械学習プロフェッショナルシリーズ)

深層学習 (機械学習プロフェッショナルシリーズ)

ちなみに、以下に並べる戯言は深層学習青本から得られた知識をベースにしています。何度でも書いておきますが、僕は機械学習の理論的な側面についてはほぼど素人なのでそこだけはご承知おきください。。。間違っている部分があったらガンガンご指摘いただけると有難いですm(_ _)m*1

*1:添え字がおかしいとかは直すのも面倒なので、雰囲気を出しただけということで何卒ご容赦を。。。

続きを読む