渋谷駅前で働くデータサイエンティストのブログ

元祖「六本木で働くデータサイエンティスト」です / 道玄坂→銀座→東京→六本木→渋谷駅前

データマイニング

Hiveで生テーブルを取ってくる→素性ベクトル+分類ラベルのテーブルに直す

現場的によくある分析のやり方 今回はちょっと実際の現場のデータサイエンス(データマイニング)の話をしてみようと思います。現在の僕の仕事は、基本的には 「Webコンテンツプラットフォーム上を回遊しているユニークユーザー(UU)の行動データをHadoopクラ…