2013-04-01から1ヶ月間の記事一覧
追記(2017年7月12日)こちらの記事がGoogle検索結果でかなり上位に来ているようですが、投稿から既に4年以上が経過しており内容としては非常に古いものになっております。よろしければ「機械学習」カテゴリの比較的新しい記事もご参照ください。tjo.hatenab…
大体どこの会社でも、KPIというと「△△数(実測数)」「○○率」のような数字が多いのではないかと思います。 そのようなKPIを特定のコンバージョン(課金・契約・定着…)と関連づけて、例えばプロモーション・UI改修・導線変更などの改善施策の効果を検証する…
(※今回は相当に難解な内容になっちゃったかもしれません) 先日はてブを沢山集めた記事で「平均への回帰」「見せかけの回帰」「共和分」について紹介したんですが、こちらのブログで言及を頂いたようです。 はっきり言って僕が書くよりも大変丁寧な説明をさ…
週末ということで、何となく書籍紹介でも。isseing333さんのブログ記事で紹介されていたのを見て、僕も買った本です。
追記(2017年8月)こちらの記事へのアクセスが未だに多いようですが、書かれてから既に4年が経過しており業界事情もだいぶ様変わりしております。このブログの「データサイエンティスト」カテゴリの他の新しい記事も是非ご覧ください。 以前の記事の続き再び…
(※今回の記事の内容はかなり難解かもです) 大竹文雄の経済脳を鍛える(2月13日分記事) 幾何ブラウン運動と見せかけの回帰 - My Life as a Mock Quant 得てして多くの企業では、「毎日の数字(売上高・利益・在庫etc.)を追いかけ」、「その結果を元手に毎…
以前新卒配属に関連して書いた記事で、「もうちょっとデータサイエンティストの定義とか育て方とか書かなきゃいけないなー」的なことを呟きましたので、何となく適当に書いてみることにします*1。 *1:僕の、インターネット企業でビッグデータ(と俗称される…
Hiveで生テーブルを取ってくる→素性ベクトル+分類ラベルのテーブルに直す 前回の記事では、Hadoopクラスタ(というかHDFS)に収納されている、いかにもありがちなユーザー行動テーブルを、機械学習で扱いやすい素性ベクトル+分類ラベルのテーブルに直す、…
そもそも僕自身やうちの部署に対して何の話もないところを見ると、13新卒の社員たちから「データサイエンティスト候補」がやってくる・・・ということはなさそうです。笑 いや、「データサイエンティストになりたい」という13新卒や、はたまた内定者がちらほ…
【第4回勉強会(社内外)のお知らせ】5月17日(水) リンク先記事の通り、5月17日(金)に『21世紀で最もセクシーな職業!?「データサイエンティスト」の実像に迫る』と題して講演させて頂く予定です。 興味をお持ちの方は、リンク先から登録のほどお願いい…
Quantitative Researcher | Facebook Careers 前の記事ではFacebookが考えるデータサイエンティストの要件、について書いたわけですが。 実は、Facebookはデータサイエンティストとは別に「データサイエンスの研究者」も募集しています。その職種名を"Quanti…
Data Scientist | Facebook Careers そもそも、データサイエンティストという職種を提唱し始めたのはFacebookだとも言われています。おそらく同様の人材は例えばGoogleやMicrosoft、Yahoo!あたりでも求めていたのだろうと思うのですが、今言われているような…
そもそもデータマイニングって何ですか データマイニング - Wikipedia Data mining - Wikipedia 実は僕もITデータサイエンス業界向けの就活始めるまで、「でーたまいにんぐ」という単語というか言葉自体を知りませんでした*1。笑 なので、正直言って未だに僕…
現場的によくある分析のやり方 今回はちょっと実際の現場のデータサイエンス(データマイニング)の話をしてみようと思います。現在の僕の仕事は、基本的には 「Webコンテンツプラットフォーム上を回遊しているユニークユーザー(UU)の行動データをHadoopクラ…
Data Scientist: The Sexiest Job of the 21st Century - HBR 「データサイエンティスト」という言葉が、世に広まるきっかけになったハーバード・ビジネス・レビューの有名な記事です。日本語版も出版されているので、お読みになった方も多いでしょう。 僕な…