渋谷駅前で働くデータサイエンティストのブログ

元祖「六本木で働くデータサイエンティスト」です / 道玄坂→銀座→東京→六本木→渋谷駅前

初めてこのブログに来た方へ

f:id:TJO:20200106165910p:plain
これは初めてこのブログに来た方々向けのトップ固定記事です。最新記事の更新状況に応じて随時更新されます。

id:TJOとは何者なのか


データサイエンティスト・機械学習人工知能)エンジニアとは何か

データ分析を仕事にしたければ読むべき本は何か

続きを読む

Fashion-MNIST: 簡単になり過ぎたMNISTに代わる初心者向け画像認識ベンチマーク

f:id:TJO:20200108100655p:plain
(MNIST database - Wikipedia)

僕は画像認識分野は門外漢なのですが、ここ最近初心者向けにCNNのトレーニングを行うことを企画していて、その目的に適した画像認識のオープンデータセットを探していたのでした。


というと誰しも思いつくのがMNISTではないかと思うのですが、Kaggleのベンチマークにも出ているように、実はMNISTはチューニングなしのデフォルトのランダムフォレストで回しても97%以上のACCが出てしまいます。そしてちょっとチューニングしたCNNなら99.7%を叩き出せてしまう上に、そういったノウハウがネットのあちこちにHello World並みのイージーハウツーコンテンツとして溢れ返っていて、初心者向け教材という意味では全く参考になりません。そこで、ちょっとサーベイして探してみることにしました。

続きを読む

「データサイエンティストが『その会社の本業部門』にしかいない」問題

f:id:TJO:20191230202529p:plain
(Image by Pixabay)

ちょっと前にこんなことを書きました。

これ、実は広告・マーケティング業界に限らずあらゆる分野業界のデータ分析事情について言えることなのですが、ここで言う「プロダクト部門」を「(その会社の)本業部門」と言い換えるとさらに普遍性の高い話であるように、僕の個人的な体験と見聞からは思われます。


ということで既に年末ポエムを書いてしまった後なのですが、今後データサイエンティスト(広義:よって機械学習エンジニアやデータアーキテクト*1などその他のデータ分析関連職種を含む)という職種の活躍範囲が広がっていくかどうかにも関わる論点の一つとして、この「データサイエンティストが『その会社の本業部門』にしかいない」問題について書いてみることにします。


なおいつもながらの但し書きですが、この記事は僕がデータ分析業界において個人的な見聞の範囲で書いたポエムに過ぎません。異論反論含めもっと広汎な経験をお持ちの方々からのフィードバックをいただけると有難いです。

*1:データアーキテクトについては「データ基盤整備以下、分析本体以外のデータ活用に関して重要な役割を担う職掌」と仮に定義しておきます。今後別の記事で改めて論じるつもりです

続きを読む

Scalabilityを追求するということ

f:id:TJO:20191201145010p:plain
(Image by Pixabay)

今年も恒例の年末振り返り記事の季節になりました(笑)。なおここ数年の年末振り返り記事はこちらから。


去年まではどちらかと言うと「stats/ML分野の進歩が早過ぎてついていけない」という愚痴半分諦め半分みたいな話をしていたわけですが、ついていけなくなった結果技術的な知識という面では周回遅れになりつつあるという段になって、僕個人の中では別の課題意識が今年になって出てきたのでした。ということで、今回の記事では今年の注目トピックを振り返りながら、その課題意識についてちょっとポエムを書いてみようと思います。

続きを読む