AIブームに完全に出遅れたエグゼクティブの方々のための本を書きました

機械学習書籍エイプリルフール

空前の人工知能ブームの中、主にエンジニアを中心とする若い人たちは必死に人工知能（機械学習）の研究開発・技術開発のトレンドを追いかけ続けているように見えますが、一方でそういう若い人たちをマネージする立場のエグゼクティブの方々を見ていると明ら…

2018-03-23

ニューラルGranger因果という論文が出たらしい（追記あり）

機械学習統計的因果推論時系列分析論文

3年前に因果フェスというイベントでGranger因果について専門家でもないのに講演させられるという稀有な経験をしたわけですが。その時のイベント報告記事で、会場でのディスカッションの内容を踏まえて僕はこんなことを書いたのでした。非線形Granger因果性…

2018-02-07

データサイエンティスト＆機械学習（人工知能）エンジニアのスキル要件と、過熱する人工知能ブームが生み出す狂騒曲と（2018年2月版：追記あり）

人材データ分析データサイエンティスト統計学機械学習機械学習エンジニア

(Image by Pixaby)この記事は去年はてブ1100以上ついてしまった与太記事の続編です。その時はタイトルを読んで字の如く「データサイエンティスト」と「機械学習エンジニア」の満たすべきスキル要件（の2017年版）について考察したものでした。で、まだ1年し…

2018-02-02

データ分析は「強者の武器」、駆け出しのうちはデータが貯まるまでの間に他にやるべきことがある

統計学機械学習データ分析ビジネス

(Image by Pixabay)こんな面白い記事が出回っているのを先日見かけたのですが。この6年弱のデータ分析業界での個人的な経験や業界内で見聞してきた知見の範囲で言うと、そもそも「データ分析は『強者の武器』であって小さな組織が使っても強い武器にはなら…

2018-01-25

"All models are wrong; but some are useful"（全てのモデルは間違っている、だが中には役立つものもある）という格言

統計学機械学習 R

George E. P. Box - Wikipedia統計学や機械学習の世界ではよく引用される"All models are wrong; but some are useful"（全てのモデルは間違っている、だが中には役立つものもある）という格言ですが、2013年に亡くなった統計学の大家George E. P. Boxの言葉…

2018-01-04

NIPS2017チュートリアルによるDeep Learningの現状まとめ

機械学習研究論文

Deep Learning_ Practice and Trends - final.pdf - Google ドライブ明けましておめでとうございます、本年もよろしくお願いいたします。新年一発目の記事はただの備忘録です。

2017-12-27

最先端と泥臭い実務の現場とのはざまで、生きる

統計学機械学習データ分析雑感年末回顧

(Photo by Pixabay)これはただの年末ポエムです。何ひとつとして高度に技術的な話もなければ、ためになる話もありませんので予めご了承ください。時が流れるのは早いもので、僕がインダストリーにおけるデータ分析の仕事を手がけるようになってから5年目の今…

2017-12-26

「人工知能」と「データサイエンティスト」の2つのブームの関係性をGoogleトレンドのデータから眺めてみる

データサイエンティスト機械学習マーケティング時系列分析統計学

そう言えば、ちょっと前のデータ分析業界5年間振り返り記事で「人工知能ブームに引っ張られてデータサイエンティストブームも再燃しつつある」みたいなことを書いたわけですが、本当にそうなんだっけ？というところをこれまでに検証したことはなかったなぁと…

2017-12-08

まとめて書評：ネットワーク分析第2版・Rによる自動データ収集・仕事ではじめる機械学習

書評書籍 R graph/network 機械学習 Python

今年も何冊か書籍をご恵贈いただいたんですが、忙しかったり他に書きたい記事があったりでそのタイミングで書評を書きそびれたものを、大変恐縮ですがこのタイミングでまとめて書かせていただこうかと思います。

2017-11-20

生TensorFlow七転八倒記(5)：ようやくCNNまでたどり着いた

Python 機械学習生TensowFlow七転八倒記 TensorFlow

前回の記事でようやくDeepっぽいところまで来たので、そのままさっさとDeepらしさの象徴でもあるCNN (Convolutional Neural Network)にいってしまおうと思います。ちなみに今回も大して参照していませんが、参考文献として深層学習青本を掲げておきます。深…

2017-11-13

生TensorFlow七転八倒記(4)：簡易版MNISTをMLPで分類してみる

機械学習 Deep Learning TensorFlow Python 生TensowFlow七転八倒記

出張していたり足底筋膜炎にかかったりしているうちに、すっかり生TensorFlowの勉強が滞ってしまっていました。とりあえず先に進みます。いつも通りですが、特に意味はないものの教科書としてこちらを挙げておきます。深層学習 (機械学習プロフェッショナル…

2017-10-17

個人的に5年間のデータ分析業界見聞録をまとめてみた

データサイエンティストデータ分析人材ビジネス統計学機械学習回顧録機械学習エンジニア

(Photo credit: https://pixabay.com/en/data-dataset-word-data-deluge-1188512/) 人工知能ブームで世間が喧しい昨今ですが、それに伴って往年に見かけたような内容のビッグデータ論やデータサイエンティスト論や機械学習システム論が再び出回るようになっ…

2017-10-04

生TensorFlow七転八倒記(3)：まずは神妙に隠れ層1個のNNで誤差逆伝播をやってみる

機械学習 TensorFlow 生TensowFlow七転八倒記 Python

何となくTFのお作法が分かってきたのでどんどん先に行きます。そう言えばただの備忘録なので何一つ出典とか参考文献とか書いてませんが、このシリーズでやっていることの理論的基礎は深層学習青本がほぼ全てカバーしています。深層学習 (機械学習プロフェッ…

2017-09-27

生TensorFlow七転八倒記(2)：線形回帰を無意味に勾配法でやる

機械学習 TensorFlow 生TensowFlow七転八倒記 Python

前回はロジスティック回帰をやったんですが、そう言えば普通の線形回帰やってなかったのでやっておきます。線形回帰は漫然とOLSでやるなら普通に逆行列計算しておしまいなんですが、それだと面白くないのであえて勾配法でやるという間抜けなことをやろうと思…

2017-09-25

生TensorFlow七転八倒記(1)：基本的なロジスティック回帰まで

機械学習 TensorFlow 生TensowFlow七転八倒記 Python

よくよく考えてみたら、TensorFlowをバックエンドとしてKerasを回したりさらにR上で動かしたりしたことはあるものの、肝心のTensorFlowを生で書いたことって数えるくらいしかなかったのでした。これではいかんと思うので、今更ながらですがTensorFlowを生で…

2017-08-26

NN Playgroundに出てくる「渦巻きサンプルの二値分類」を学習器を変えながら試してみる（追記あり）

R 機械学習 DeepLearning実践シリーズ

A Neural Network PlaygroundというDeep Learningのパラメータを変えながらその挙動を見て学べる（楽しめる）サイトがTensorFlowプロジェクトからの提供であるんですが、そのサンプルデータセットの4番目に「渦巻きサンプル」（別名「スイスロール」）があり…

2017-08-11

不均衡データをundersampling + baggingで補正すると汎化性能も確保できて良さそう

R 機械学習

弊社のランチゲストにお招きしたことのある[twitter:@tmaehara]さんが、こんなことをツイートしておられました。imbalanced data に対する対処を勉強していたのだけど，[Wallace et al. ICDM'11] https://t.co/ltQ942lKPm … で「undersampling + bagging を…

2017-06-25

データサイエンティストもしくは機械学習エンジニアになるためのスキル要件とは（2017年夏版）

データサイエンティストデータ分析人材統計学機械学習機械学習エンジニア

この記事は2年前の以下の記事のアップデートです。前回はとりあえずデータサイエンティストというかデータ分析職一般としてのスキル要件として、「みどりぼん程度の統計学の知識」「はじパタ程度の機械学習の知識」「RかPythonでコードが組める」「SQLが書け…

2017-06-02

RにTensorFlow + Kerasを実装した{keras}パッケージがやって来たので試してみた（追記2件あり）

R 機械学習 DeepLearning実践シリーズ Deep Learning

Python側でのTensorFlowの隆盛を他所に、R側では{tensorflow}も使いにくいし*1これはPythonistaに転生しなければならんのかなぁ。。。ということを思っていたら、出ました。あのKerasのRパッケージです。インストール手順は普通にhttps://rstudio.github.io/…

2017-05-28

異常検知に用いられる1クラスSVMの決定境界をパラメータを変えながら描いてみた

R 機械学習異常検知

これは前回の記事の補足です。もう見たまんまで「そもそも1クラスSVMの決定境界を具体的に描画してみたらどうなるんだろう？」という興味を持ったので、漫然と2次元でやってみます。前回の記事同様、1クラスSVMの推定に用いるのは{e1071}パッケージのsvm関数…

2017-05-23

Rで異常検知(3): 非正規データからの異常検知（カーネル密度推定・EMアルゴリズム・K-means・1クラスSVM）

R 機械学習異常検知

（注：ただの備忘録ゆえ、ほぼ確実に後で追記が出る見込みです）今回はコロナ社井手本の第3章を取り上げます。入門機械学習による異常検知―Rによる実践ガイド作者: 井手剛出版社/メーカー: コロナ社発売日: 2015/02/19メディア: 単行本この商品を含むブログ…

2017-04-01

データ前処理コンペサイト"Struggle"を開設しました

データ分析機械学習エイプリルフール

機械学習コンペと言えばKaggleというのはもはや世の中の常識（一部誇張表現あり）になりつつありますが、「データ分析プロジェクトの8割が前処理」という現実を目の当たりにし続けている身としては「そんなRDBSにデータが入った先の綺麗なところで戦うのもあ…

2017-03-22

データサイエンティストもしくは機械学習エンジニアを目指すならお薦めの初級者向け6冊＆中級者向け15冊（2017年春版）

書評書籍統計学機械学習データ分析データサイエンティスト統計的因果推論機械学習エンジニア

(Photo credit: https://pixabay.com/en/books-door-entrance-italy-colors-1655783/)この記事は一昨年のこの書籍紹介記事のアップデート版です。相変わらず毎月のように新刊書が出続けるデータ分析業界ですが、良い本が増え続けてきたせいでついに初級者向…