どうも、初めまして。TJOと申します。
道玄坂にある会社で、データサイエンティストとして働いております。それまでは、アカデミック業界で6年間実験科学分野の研究者をしておりました。その頃はずっと実験データのデータマイニングを手掛けており、長じてITデータサイエンス業界に転じた次第です。
ちなみに、自己紹介みたいなものはLinkedInの公開ページで少しだけご覧になれます(会員版はもっと細かいです)。
http://jp.linkedin.com/in/tjozaki
・・・と書いたところで、いきなり皆さんからのツッコミの数々が聞こえてきそうです。「データサイエンティスト?それって何なん?」「それどういう仕事?」「最近流行りの職業らしいんだけど怪しくね?」「データサイエンスって言葉よく聞くけどそれってどんな学問なの?」etc.
このブログでは、そういう「データサイエンス」「データサイエンティスト」にまつわるあれやこれやについて、実際にIT企業のデータサイエンス部門の現場で働く一人のデータサイエンティストとして、ここで書ける範囲のことを綴っていこうと考えております。
具体的には、こんな感じのことをゆるーく書き綴っていこうかなと。
- データサイエンティストってどんな職業?
- どうやったらデータサイエンティストになれる?
- 普段データサイエンティストは何をしているの?
というエントリー的な話題から、
- Hadoopから抽出されるユーザー行動データの前処理
- ユニークユーザーの購買行動の分析手法選択について
- KPI着予をできるだけ正確に出すにはどうしたら良いか
- 複数KPI時系列間での因果関係の推定
- CVRを向上させるためのユーザー導線のデータマイニングに基づく最適化
- 意思決定レベルへのレポーティング&提案の実際
といったデータサイエンスの専門的な話題まで、各種IT業界系メディア、マーケティング業界系メディア、データマイニング+WEB@東京やSIGKDD辺りで展開されている議論を意識しながら、つらつらと綴っていきたいと考えております。
もちろん、これらのテーマに関しては良い記事や資料も既に沢山あります。今時はslideshareなんて素晴らしいものがありますので、例えば「データサイエンティストとは何ぞや?」という点については
- データサイエンティストのつくり方
- (道具としての)データサイエンティストのつかい方
- Big Data [sorry] & Data Science: What Does a Data Scientist Do?
なんかをご覧になれば、僕がうだうだ書くまでもないかもしれません。
けれども、実際にIT企業のデータサイエンス部門で、ビッグデータ(と世間では呼ばれている何か)と現場で格闘しながら、自社の経営改善業務に取り組んでいる経験を交えて、ここに書き留めていけばいつか誰かの役に立つかもしれないかも?と思ってます。
ちなみに、実は僕は(おそらく)この勉強会の5月の会で講師を務める予定でして、それに関連した話題や資料の共有のためにもこのブログを活用していければと考えている次第です。
ということで、皆さんよろしくお願いいたします。
※自社ブログサービス使いたかったんですが、syntax highlightingの使いやすさからはてなブログにしました。同僚の皆さんごめんなさい。。。