渋谷駅前で働くデータサイエンティストのブログ

元祖「六本木で働くデータサイエンティスト」です / 道玄坂→銀座→東京→六本木→渋谷駅前

2013-01-01から1年間の記事一覧

素性ベクトル+分類ラベルのテーブルを持ってくる⇒Rを使ってお手軽に機械学習で分類してみる

Hiveで生テーブルを取ってくる→素性ベクトル+分類ラベルのテーブルに直す 前回の記事では、Hadoopクラスタ(というかHDFS)に収納されている、いかにもありがちなユーザー行動テーブルを、機械学習で扱いやすい素性ベクトル+分類ラベルのテーブルに直す、…

新卒配属の季節ではありますが

そもそも僕自身やうちの部署に対して何の話もないところを見ると、13新卒の社員たちから「データサイエンティスト候補」がやってくる・・・ということはなさそうです。笑 いや、「データサイエンティストになりたい」という13新卒や、はたまた内定者がちらほ…

5月の講演会でお話します

【第4回勉強会(社内外)のお知らせ】5月17日(水) リンク先記事の通り、5月17日(金)に『21世紀で最もセクシーな職業!?「データサイエンティスト」の実像に迫る』と題して講演させて頂く予定です。 興味をお持ちの方は、リンク先から登録のほどお願いい…

Facebookが考えるデータサイエンス「研究者」の要件

Quantitative Researcher | Facebook Careers 前の記事ではFacebookが考えるデータサイエンティストの要件、について書いたわけですが。 実は、Facebookはデータサイエンティストとは別に「データサイエンスの研究者」も募集しています。その職種名を"Quanti…

Facebookが考えるデータサイエンティストの要件

Data Scientist | Facebook Careers そもそも、データサイエンティストという職種を提唱し始めたのはFacebookだとも言われています。おそらく同様の人材は例えばGoogleやMicrosoft、Yahoo!あたりでも求めていたのだろうと思うのですが、今言われているような…

データマイニングとはどんなもので、それで何ができるのか?(主にビジネス系の方々向け)

そもそもデータマイニングって何ですか データマイニング - Wikipedia Data mining - Wikipedia 実は僕もITデータサイエンス業界向けの就活始めるまで、「でーたまいにんぐ」という単語というか言葉自体を知りませんでした*1。笑 なので、正直言って未だに僕…

Hiveで生テーブルを取ってくる→素性ベクトル+分類ラベルのテーブルに直す

現場的によくある分析のやり方 今回はちょっと実際の現場のデータサイエンス(データマイニング)の話をしてみようと思います。現在の僕の仕事は、基本的には 「Webコンテンツプラットフォーム上を回遊しているユニークユーザー(UU)の行動データをHadoopクラ…

スーパーマン、三位一体、それとも?:データサイエンティストの定義を考える

Data Scientist: The Sexiest Job of the 21st Century - HBR 「データサイエンティスト」という言葉が、世に広まるきっかけになったハーバード・ビジネス・レビューの有名な記事です。日本語版も出版されているので、お読みになった方も多いでしょう。 僕な…

僕がデータサイエンスの世界で働くモチベーション

端的に言えば「Web時代の人々の『行動』を知り尽くしたい」といったところでしょうか。

ブログを始めてみた。(来たるべき勉強会に備えて)

どうも、初めまして。TJOと申します。 道玄坂にある会社で、データサイエンティストとして働いております。それまでは、アカデミック業界で6年間実験科学分野の研究者をしておりました。その頃はずっと実験データのデータマイニングを手掛けており、長じてIT…