渋谷駅前で働くデータサイエンティストのブログ

元祖「六本木で働くデータサイエンティスト」です / 道玄坂→銀座→東京→六本木→渋谷駅前

『マスターアルゴリズム』は全ての人々を機械学習(人工知能)の世界へといざなう「冒険物語」

f:id:TJO:20210516133604p:plain

しましま先生(@shima__shima)こと神嶌敏弘先生から、訳書『マスターアルゴリズム』をご恵贈いただきました。

本書はビル・ゲイツが「AIを知るための本」と絶賛したという"The Master Algorithm"の邦訳版で、実際に「難しい理論や数式は書かれていないがこの一冊を読むだけで現代の機械学習人工知能)の世界の全容を一望できる」優れた本だと個人的には感じました。また縦書き本ゆえいわば「読み物」的な立ち位置の書籍であり、研究者や技術者のみならずビジネスパーソンさらには一般の読書家にとっても読みやすく、尚且つ得るものの大きい一冊だと思います。


ということで、以下簡単にレビューしていきたいと思います。なお実は僕自身もしましま先生から発刊前の段階で翻訳内容の閲読を依頼されて一通り目を通していた*1という経緯がありますので、その点はCOIということで贔屓目があるかもしれない点予めご了承ください。


ちなみにしましま先生もご自身のサイトに特設ページを開設されていて、訳者の視点から各章の内容を簡潔にまとめた紹介がされています。お急ぎの方は是非そちらをお読みください。というか、こちらの方が本来の本書のプロモーションページなので、僕なんぞが以下に書き散らした書評はむしろ蛇足な駄文ですね……(汗)。

*1:特に第4章含めて「神経科学分野に関する記述のチェックをして欲しい」という依頼を頂戴していました

続きを読む

何故データサイエンティストになりたかったら、きちんと体系立てて学ばなければならないのか

f:id:TJO:20210513211022p:plain

先日、Quora日本語版でこんなやり取りがありました。

基本的にはここで述べた通りの話なのですが、折角なのでブログの方でも記事としてちょっとまとめておこうと思います。題して「何故データサイエンティストになりたかったら、きちんと体系立てて学ばなければならないのか」というお話です。

問題意識としては毎回引き合いに出しているこちらの過去記事で論じられているような「ワナビーデータサイエンティスト」たちをどう導くべきかという議論が以前から各所であり、それらを念頭に置いています。なお毎度のことで恐縮ですが、僕も基本的には独学一本の素人ですので以下の記述に誤りや説明不足の点などあればご指摘くださると幸いです。

続きを読む

RでK-meansの最適なクラスタ数をAIC / BICに基づいて求める

これはただの備忘録です。既知の話題ばかりが並べられているので、特に新鮮味のない内容である点予めご容赦ください。

クラスタリング手法として広く知られるK-meansは、その簡便さから非常に広汎に使われていますが、一方で「クラスタ数を恣意的に決め打ちせざるを得ない」という難点があり、「最適なクラスタ数をどうやって決めるか」という課題が長年に渡ってあります。この課題の解決策についてちょっと調べてみたので、以下にまとめてみました。

続きを読む