2013-01-01から1年間の記事一覧
Hiveで生テーブルを取ってくる→素性ベクトル+分類ラベルのテーブルに直す 前回の記事では、Hadoopクラスタ(というかHDFS)に収納されている、いかにもありがちなユーザー行動テーブルを、機械学習で扱いやすい素性ベクトル+分類ラベルのテーブルに直す、…
そもそも僕自身やうちの部署に対して何の話もないところを見ると、13新卒の社員たちから「データサイエンティスト候補」がやってくる・・・ということはなさそうです。笑 いや、「データサイエンティストになりたい」という13新卒や、はたまた内定者がちらほ…
【第4回勉強会(社内外)のお知らせ】5月17日(水) リンク先記事の通り、5月17日(金)に『21世紀で最もセクシーな職業!?「データサイエンティスト」の実像に迫る』と題して講演させて頂く予定です。 興味をお持ちの方は、リンク先から登録のほどお願いい…
Quantitative Researcher | Facebook Careers 前の記事ではFacebookが考えるデータサイエンティストの要件、について書いたわけですが。 実は、Facebookはデータサイエンティストとは別に「データサイエンスの研究者」も募集しています。その職種名を"Quanti…
Data Scientist | Facebook Careers そもそも、データサイエンティストという職種を提唱し始めたのはFacebookだとも言われています。おそらく同様の人材は例えばGoogleやMicrosoft、Yahoo!あたりでも求めていたのだろうと思うのですが、今言われているような…
そもそもデータマイニングって何ですか データマイニング - Wikipedia Data mining - Wikipedia 実は僕もITデータサイエンス業界向けの就活始めるまで、「でーたまいにんぐ」という単語というか言葉自体を知りませんでした*1。笑 なので、正直言って未だに僕…
現場的によくある分析のやり方 今回はちょっと実際の現場のデータサイエンス(データマイニング)の話をしてみようと思います。現在の僕の仕事は、基本的には 「Webコンテンツプラットフォーム上を回遊しているユニークユーザー(UU)の行動データをHadoopクラ…
Data Scientist: The Sexiest Job of the 21st Century - HBR 「データサイエンティスト」という言葉が、世に広まるきっかけになったハーバード・ビジネス・レビューの有名な記事です。日本語版も出版されているので、お読みになった方も多いでしょう。 僕な…
端的に言えば「Web時代の人々の『行動』を知り尽くしたい」といったところでしょうか。
どうも、初めまして。TJOと申します。 道玄坂にある会社で、データサイエンティストとして働いております。それまでは、アカデミック業界で6年間実験科学分野の研究者をしておりました。その頃はずっと実験データのデータマイニングを手掛けており、長じてIT…