渋谷駅前で働くデータサイエンティストのブログ

元祖「六本木で働くデータサイエンティスト」です / 道玄坂→銀座→東京→六本木→渋谷駅前

2013-11-01から1ヶ月間の記事一覧

パッケージユーザーのための機械学習(2):ロジスティック回帰

(※はてなフォトライフの不具合で正しくない順番で画像が表示されている可能性があります) だらだらと機械学習をパッケージで回していく様子を眺めるこのシリーズ、今回はロジスティック回帰をやってみようと思います。ロジスティック回帰はどちらかという…

「日本型データサイエンティストの登場を契機に活用が進展」記事について二言三言

先日、Twitter上&FB上にこんな記事が出回っていたので読んでみました。 日本型データサイエンティスト、CDO、CAO:日本型データサイエンティストの登場を契機に活用が進展、野村総合研究所が予想 - ITmedia マーケティング データ分析をビジネスに活用する…

パッケージユーザーのための機械学習(1):決定木

(※はてなフォトライフの不具合で正しくない順番で画像が表示されている可能性があります) だいぶ前に「糞コードで頑張る機械学習シリーズ」と言うのを始めようとしたんですが、パーセプトロンをPythonで実装した次にMatlabで書いたSMO-SVMコードをPythonに…

『データサイエンス超入門』は統計学&機械学習の入門書としてはお薦めできない→データ分析に特化したビジネス書としては良書

発売から間もなくその内容についてTwitter上で妙な伝聞やら伝言ゲームが飛び交っていたこの本。実は僕もその伝言ゲームに巻き込まれた*1もので、だったら現物を読んで書評してやろうじゃないかということで有楽町の三省堂で買ってきたのでした。それがこちら…

「パラメトリック検定」と「ノンパラメトリック検定」の違いについて出典を明示して書いておく

最近また色々な新刊書で「パラメトリックvs.ノンパラメトリック検定の違い」について正確でない説明を見かけることが増えてきたので、ちょっと出典を明示して備忘録的に書いておこうと思ったのでした。

データサイエンティストはこうやってデータ分析の仕事をしている(自分の経験と見聞談をもとに)

誰かの参考になるかもしれないと思って、僕の前職時代の取り組み方や他の現場で僕とよく似たアドホック分析系の仕事をされている方から聞き取った内容をもとに、適当にまとめてみました。 ということで、これは正確には「アドホック分析系データサイエンティ…

データ分析の現場で頻出のセリフあるある10選

何だかふと思い付いたので、つらつら書いてみました。10個全てを口走ってしまったことのある人は要注意ということで(笑)。 「データサイエンティストなんてただのバズワード」 誰でも言って構わないセリフとして広く認められています。ただし、これを言っ…

現職場の公式テックブログ始まりました

ちらっとTwitterでもコメントしましたが、現職場でも公式ブログ始まりました。テックブログ45選という記事には間に合わなかったのが残念ですが。。。 RCO アドテクLabブログ もうタイトル見たまんまです(笑)。基本的には社内エンジニアによるテックブログ…

MCMCの計算にStanを使ってみた(超基礎・導入編)

肝心のMCMCの勉強はどこ行ったゴルァとか怒られるとアレなんですが、先にツールの使い方覚えてしまおうと思ってStanで簡単な練習をやってみました。ちなみに参考にした資料はこちら。 Stanチュートリアルの資料を作成しました。 - Analyze IT. StanTutorial …

データサイエンティストがビジネスに貢献するために心得ておくべき「4つの定石」

この三連休にはてブで盛り上がってたこちらの記事、なかなか面白く拝読しました。 「あいつ・・・なにやってるの?」データサイエンティストを殺す4つの環境 - dataminer.me データサイエンティストを殺すための4つの環境 データサイエンティストの評価者が…