2018-05-19

時変係数動的線形モデルをStanで推定してみる（追記あり）

R BUGS/Stan 時系列分析統計学

これはただの備忘録です。目新しい内容は特に何もありません。きちんとした内容を学びたいという方は、先日著者の萩原さんからご恵贈いただいたこちらの書籍で学ばれることをお薦めいたします。MCMCに留まらず、粒子フィルタの実装＆実践までカバーしていて素晴らしい教科書だと思います。

基礎からわかる時系列分析 ―Rで実践するカルマンフィルタ・MCMC・粒子フィルター (Data Science Library)

作者: 萩原淳一郎,瓜生真也,牧山幸史,石田基広
出版社/メーカー: 技術評論社
発売日: 2018/03/23
メディア: 大型本
この商品を含むブログ (1件) を見る

で、今回取り上げるのは時変係数から成る動的線形モデルです。マーケティング分析では割と時不変係数モデルが暗黙のうちに採用されることが多いのですが、一方で「おいこれどう見ても特定の特徴量の係数は時変やろ」みたいなケースも時々見かけることがあってやろうとは思っていたものの、単にStanでどう書くか考えるのが面倒で放っていたという（笑）。ということで、今回は真面目にやってみようと思います。

2018-05-15

「データを集める前にデータ分析責任者（データサイエンティスト）を雇うべき」理由とは

データ分析ビジネスデータサイエンティスト

f:id:TJO:20160716180212j:plain
(Image by Pixabay)

先日こんな記事が注目を集めていたのを見かけたのでした。

ここで大事なのは、データ集めは非常に大事なステップですが、最初の0.8歩に過ぎないということです。データ解析やAI技術導入の準備に時間をかけすぎていて、｢やっとビッグデータが溜まった｣と思ったときにデータサイエンティストに大量のデータを丸投げする、というプロセスは非効率的なのです。

それよりも、最初の段階からデータサイエンティストを交えて、ゴールを志向しながら逆算的アプローチでデータを収集、解析した方が良い結果が確実に出ます。

これはもう、日本のデータ分析業界で色々な現場の話を見聞してきた日本で働くデータサイエンティストの身としては、耳が痛いを通り越して耳から血を噴きそうな話です。にもかかわらず、こういう話をデータ分析業界「以外」の人たちに話してもなかなかピンと来ない人が多いのか「？」という顔をされがちなのが現状です。

ということで最近与太記事が続いていて恐縮なのですが、今回も「何故データを集める前にデータサイエンティストを雇うべきなのか」という与太記事を書いてみようと思います。

2018-04-24

機械学習をやる上で必要な数学とは、どの分野のどのレベルの話なのか（数学が大の苦手な人間バージョン）

機械学習生TensowFlow七転八倒記 TensorFlow Python

しばらく前にこんな記事が出ていたのをお見かけしました。

明らかにこれは僕が某所（笑）で適当に放言したことがきっかけで巻き起こった議論の一旦なのではないかと思うのですが、個人的にはこちらの@yohei_kikutaさんの仰る通りで大体良いのではないかと考えております。

なのですが、言い出しっぺらしき身としてはもうちょっと何か具体的な話を書いた方が良いのかな？とも思いましたので、常々公言しているように数学が大の苦手な身ながらどの分野のどのレベルの数学が機械学習をやっていく上で必要なのかという点について戯言だらけの駄文を書いてみることにします。

深層学習 (機械学習プロフェッショナルシリーズ)

作者: 岡谷貴之
出版社/メーカー: 講談社
発売日: 2015/04/08
メディア: 単行本（ソフトカバー）
この商品を含むブログ (13件) を見る

ちなみに、以下に並べる戯言は深層学習青本から得られた知識をベースにしています。何度でも書いておきますが、僕は機械学習の理論的な側面についてはほぼど素人なのでそこだけはご承知おきください。。。間違っている部分があったらガンガンご指摘いただけると有難いですm(_ _)m*1

*1:添え字がおかしいとかは直すのも面倒なので、雰囲気を出しただけということで何卒ご容赦を。。。

渋谷駅前で働くデータサイエンティストのブログ

元祖「六本木で働くデータサイエンティスト」です / 道玄坂→銀座→東京→六本木→渋谷駅前

時変係数動的線形モデルをStanで推定してみる（追記あり）

「データを集める前にデータ分析責任者（データサイエンティスト）を雇うべき」理由とは

機械学習をやる上で必要な数学とは、どの分野のどのレベルの話なのか（数学が大の苦手な人間バージョン）