六本木で働くデータサイエンティストのブログ

元祖「銀座で働くデータサイエンティスト」です / 道玄坂→銀座→東京→六本木

データ分析人材の長期的キャリアという迷宮

f:id:TJO:20190508155555p:plain
(Image by Pixabay)

先日出たこんな記事が注目を集めていたようです。

私はデータサイエンス的エンジニアになりたいのか?データサイエンス的コンサルタントになりたいのか?なんもわからん

タイトルにもなっていて、記事中で提起されている「データ分析者のキャリアなんもわからん問題」は僕にとっても全くもって他人事ではありません。一方で僕自身この仕事をするようになって7年ほどが経ち、データ分析人材がどのようなキャリアをたどっていくかについてある程度見聞や知見が貯まってきているということもあります。


ということで、あくまでも僕自身が見聞した範囲での話にはなりますが、データ分析人材即ちデータサイエンティスト&機械学習人工知能)エンジニアの長期的なキャリアがどのようなものになっていくかについて、ちょっと考察してみようと思います。勿論異論・反論色々あり得るかと思いますので、コメント欄なりブコメなりでお寄せいただけると有難いですm(_ _)m

続きを読む

TensorFlow Probabilityのtfp.stsモジュールを使って構造時系列モデリングを回してみる

TensorFlow Probability (TFP)がリリースされてからしばらく経ちますが、最近になってこんなモジュールが公開されたと知りました。

Framework for Bayesian structural time series modelsと題されている通りで、ズバリTFPベイズ構造時系列モデルを推定するためのモジュールです。




ベイズ構造時系列モデルの推定は以前このブログでもRStanやRの{bsts}パッケージを使って散々やりましたが、そもそもTFPはサンプリング手法にHMCを使うなど割とStanとの共通点が多く、またこのtfp.stsモジュール自体がそのクラスのネーミングからしてどう見ても{bsts}を意識したものなので、それらを時系列データ分析に使ってきた人にとっては取っ付きやすいかもしれません。


ということで、かなり大雑把にですが使い心地を試してみようと思います。ただ、最後までお読みになればお分かりになるかと思いますが色々つまずいたところもありますので、解決策をご存知の方はどしどしご指摘くださると有難いですm(_ _)m

続きを読む

機械学習のビジネス上の価値を「効果測定」して「数値評価」する方法

f:id:TJO:20190221111234p:plain
(Image by Pixabay)

気が付けば、日本における第一次データサイエンティストブームから6年、人工知能ブーム開始から3年が経ったようです。意外と言っては何ですが、これまでのところ人工知能ブームも、そしてそれにブーストされた形で起こった第二次データサイエンティストブームも、まだまだ続くどころかどんどん加速していきそうな状況です。


なのですが、これだけ統計学機械学習のような高度なデータ分析技術がビジネスの現場に浸透するようになった現在でも、なぜかあまり多く見かけないものがあります。それは機械学習(もしくは自動化された統計分析)によるビジネス上の成果を数値として示したもの」。意外かもしれませんが、個人的な観測範囲では例えば「Deep Learningを導入したら〇〇がXX%向上した」みたいなリリースや記事を見かけることは、正直なところ思った以上に少ないように思われます。それでも第一次データサイエンティストブームだった2013-14年頃はそういう事例記事を時々見かけましたが、最近はあまり見ない気がします。


それは単に、ビジネス的な競争力の根幹に関わる部分なので各社ともひた隠しにしているだけなのかもしれません。もしくは、もしかしたら実は世の中機械学習を導入しても特にビジネス上のプラスのインパクトがない事例ばっかりなのかもしれません。さもなくば、そもそもビジネス上のインパクトを「効果測定」して「数値評価」する枠組みを整えていないだけなのかもしれません。もしそうであるならば、これほど勿体無い話もないと思うのです。


第一次データサイエンティストブームから6年、そして人工知能ブーム開始から3年が経った今、データ分析業界がやるべきは「統計学機械学習やデータサイエンスでビジネス上の価値を数値評価できる形で出せた」という「成功事例」をもっと世に出していくことだと個人的には考えています。言い換えれば、そろそろ「論より証拠」の時期であろうと。そこで、そういう「効果測定」「数値評価」の方法としてどんなものがあり得るかを大雑把に論じてみようと思います。

続きを読む