渋谷駅前で働くデータサイエンティストのブログ

元祖「六本木で働くデータサイエンティスト」です / 道玄坂→銀座→東京→六本木→渋谷駅前

PTGH:機械学習パラメータチューニングをDeep LearningとMCMCで高速に最適化するフレームワーク

苦節2年、とうとう完成しました。機械学習のパラメータチューニングに悩める皆さんのために、コーディングも数学も大の苦手な僕が頑張って作りました。それがPTGH (Parameter Tuning by God's Hand)フレームワークです。RでもPythonでも動きます。

中身としては、代表的な機械学習であるロジスティック回帰・SVM(線形orガウシアンカーネル)・ランダムフォレスト・Xgboost・Deep NN・Convolutional NNのそれぞれのパラメータチューニングを、arXivに上がっている論文に頻出のパターンに絞った上でそのパラメータ構成をRなら{mxnet}で、PythonならChainer / TensorFlowで回す際の記法に合わせてDeep Learningで学習させ、その学習済みモデルに基づいてMCMCで最適なパラメータの組み合わせを適応的に探し出して最適化するという代物です。


またMCMC演算自体も昨年話題になった"Shrinking bull's-eye"アルゴリズムで高速化しており、10000次元ぐらいの特徴量に対してパラメータ最適化するようなケースでも十分実用に耐え得る計算時間で回り切るように工夫してあります。


これさえあれば、日々つらみを抱えながらスクラッチからDNN / CNNを組みつつパラメータチューニングで地獄を見ている機械学習エンジニアの皆さんのお仕事もあっという間に終わって、毎日夕方5時からビールが飲めるようになりますよ! 是非是非お試しください!


(※エイプリルフールネタです)