渋谷駅前で働くデータサイエンティストのブログ

元祖「六本木で働くデータサイエンティスト」です / 道玄坂→銀座→東京→六本木→渋谷駅前

2013-04-01から1ヶ月間の記事一覧

「機械学習とは何ぞや」をゆるーく説明してみる

追記(2017年7月12日)こちらの記事がGoogle検索結果でかなり上位に来ているようですが、投稿から既に4年以上が経過しており内容としては非常に古いものになっております。よろしければ「機械学習」カテゴリの比較的新しい記事もご参照ください。tjo.hatenab…

「カイゼンしたらコンバージョン率が○○%→△△%にup!」は分母を無視したら成り立たないかもしれない

大体どこの会社でも、KPIというと「△△数(実測数)」「○○率」のような数字が多いのではないかと思います。 そのようなKPIを特定のコンバージョン(課金・契約・定着…)と関連づけて、例えばプロモーション・UI改修・導線変更などの改善施策の効果を検証する…

見せかけの回帰について(そして単位根過程・共和分など)

(※今回は相当に難解な内容になっちゃったかもしれません) 先日はてブを沢山集めた記事で「平均への回帰」「見せかけの回帰」「共和分」について紹介したんですが、こちらのブログで言及を頂いたようです。 はっきり言って僕が書くよりも大変丁寧な説明をさ…

ビジネスの現場でデータマイニングに取り組むなら必読の一冊(ただし洋書)

週末ということで、何となく書籍紹介でも。isseing333さんのブログ記事で紹介されていたのを見て、僕も買った本です。

未経験者はどうすればデータサイエンティストになれるか

追記(2017年8月)こちらの記事へのアクセスが未だに多いようですが、書かれてから既に4年が経過しており業界事情もだいぶ様変わりしております。このブログの「データサイエンティスト」カテゴリの他の新しい記事も是非ご覧ください。 以前の記事の続き再び…

「毎日の数字を追いかけ、毎日改善する」ことの意外な落とし穴

(※今回の記事の内容はかなり難解かもです) 大竹文雄の経済脳を鍛える(2月13日分記事) 幾何ブラウン運動と見せかけの回帰 - My Life as a Mock Quant 得てして多くの企業では、「毎日の数字(売上高・利益・在庫etc.)を追いかけ」、「その結果を元手に毎…

どんな人がデータサイエンティストに向いているのか?

以前新卒配属に関連して書いた記事で、「もうちょっとデータサイエンティストの定義とか育て方とか書かなきゃいけないなー」的なことを呟きましたので、何となく適当に書いてみることにします*1。 *1:僕の、インターネット企業でビッグデータ(と俗称される…

素性ベクトル+分類ラベルのテーブルを持ってくる⇒Rを使ってお手軽に機械学習で分類してみる

Hiveで生テーブルを取ってくる→素性ベクトル+分類ラベルのテーブルに直す 前回の記事では、Hadoopクラスタ(というかHDFS)に収納されている、いかにもありがちなユーザー行動テーブルを、機械学習で扱いやすい素性ベクトル+分類ラベルのテーブルに直す、…

新卒配属の季節ではありますが

そもそも僕自身やうちの部署に対して何の話もないところを見ると、13新卒の社員たちから「データサイエンティスト候補」がやってくる・・・ということはなさそうです。笑 いや、「データサイエンティストになりたい」という13新卒や、はたまた内定者がちらほ…

5月の講演会でお話します

【第4回勉強会(社内外)のお知らせ】5月17日(水) リンク先記事の通り、5月17日(金)に『21世紀で最もセクシーな職業!?「データサイエンティスト」の実像に迫る』と題して講演させて頂く予定です。 興味をお持ちの方は、リンク先から登録のほどお願いい…

Facebookが考えるデータサイエンス「研究者」の要件

Quantitative Researcher | Facebook Careers 前の記事ではFacebookが考えるデータサイエンティストの要件、について書いたわけですが。 実は、Facebookはデータサイエンティストとは別に「データサイエンスの研究者」も募集しています。その職種名を"Quanti…

Facebookが考えるデータサイエンティストの要件

Data Scientist | Facebook Careers そもそも、データサイエンティストという職種を提唱し始めたのはFacebookだとも言われています。おそらく同様の人材は例えばGoogleやMicrosoft、Yahoo!あたりでも求めていたのだろうと思うのですが、今言われているような…

データマイニングとはどんなもので、それで何ができるのか?(主にビジネス系の方々向け)

そもそもデータマイニングって何ですか データマイニング - Wikipedia Data mining - Wikipedia 実は僕もITデータサイエンス業界向けの就活始めるまで、「でーたまいにんぐ」という単語というか言葉自体を知りませんでした*1。笑 なので、正直言って未だに僕…

Hiveで生テーブルを取ってくる→素性ベクトル+分類ラベルのテーブルに直す

現場的によくある分析のやり方 今回はちょっと実際の現場のデータサイエンス(データマイニング)の話をしてみようと思います。現在の僕の仕事は、基本的には 「Webコンテンツプラットフォーム上を回遊しているユニークユーザー(UU)の行動データをHadoopクラ…

スーパーマン、三位一体、それとも?:データサイエンティストの定義を考える

Data Scientist: The Sexiest Job of the 21st Century - HBR 「データサイエンティスト」という言葉が、世に広まるきっかけになったハーバード・ビジネス・レビューの有名な記事です。日本語版も出版されているので、お読みになった方も多いでしょう。 僕な…