渋谷駅前で働くデータサイエンティストのブログ

元祖「六本木で働くデータサイエンティスト」です / 道玄坂→銀座→東京→六本木→渋谷駅前

初めてこのブログに来た方へ

f:id:TJO:20200106165910p:plain
これは初めてこのブログに来た方々向けのトップ固定記事です。最新記事の更新状況に応じて随時更新されます。

はじめに


公式のプロフィールはLinkedInに掲載しております。


このブログの内容は個人の意見・見解の表明であり、所属組織の意見・見解を代表しません。またブログ記事の内容の正確性については一切保証いたしません。学術的・技術的コンテンツを求めて来訪された方は、必ず学術書や論文などのオーソライズされた資料を併せてご参照ください。むしろ僕自身の学習のプロセスを記録しているだけの備忘録的記事が多いため、誤りもまた多いはずです。後学のため、誤りを見つけた場合はコメント欄などでお知らせいただけると有難いです。


また、ブログの中で取り上げられているデータ分析事例・データセット・分析上の知見など全ての記述は、いずれも特別に明記されていない限りはいかなる実在する企業・組織・機関の、いかなる個別の事例とも無関係です。ブログ記事内容は予告なく公開後に改変されることがあります。改変した事実は明示されることもあれば明示されないこともあります。


このブログはあくまでも僕自身にとっての備忘録であり、利便を考えてweb上に公開しているだけという位置付けのものです。中にはその見かけとは全く別の真の目的をもって書かれた記事もあります。以上の点をご理解の上、お読み下さると有難いです。

id:TJOとは何者なのか

データサイエンティスト・機械学習人工知能)エンジニアとは何か

データ分析を仕事にしたければ読むべき本は何か

続きを読む

SVMは復権し得るか?

Kaggleはすっかりただの野次馬の一人になって久しいんですが、しばらく前に行われたPetFinder.my - Pawpularity Contestというコンペで優勝者がSVRサポートベクター回帰)を使ったことが話題になっていたというのを聞いて、NN全盛のこのご時世に意外だなと思ったのでした。


しかし、よくよく考えてみればかのVapnik御大がかつてSVMを考案する際にベースとしたアイデアはNNとは方向性の違う代物だったわけです。故に、例えばSVMとNNとがどのような点で異なるかが「見える化」出来れば、SVM復権するための条件のようなものが見えてきそうです。


ということで、久しぶりに「サンプルデータで試す機械学習シリーズ」をやってみようと思います。実はDNNについては6年前にも似たようなことをやっているのですが、SVMとDNNとでサンプルサイズを変えながら比較するというのはやったことがないので、今回が初めての試みです。ちなみにGBDT*1も本来は合わせて比較した方が良いのかもしれませんが、単純に面倒なので割愛しました。もしかしたら後日追記で入れるかもしれません。

*1:ブコメで突っ込まれて「GDBT」と書いていたことに気づきました、ご指摘有難うございます

続きを読む

深部静脈血栓症(DVT)に罹りました


(Image by MasterTux from Pixabay)

あまりこういう私事はブログでは書いてこなかったのですが、今後の備忘録も兼ねて記事として書き留めておこうと思います。

Twitterなどでは既に書いている話ですが、タイミング悪く実家の親父が危篤になった時期に並行して、僕は深部静脈血栓症(Deep Venous Thrombosis: DVT)という厄介な病気に罹っていると診断されました。45歳という年齢にしては珍しい病気ですが、かつて元サッカー日本代表高原直泰選手も22歳で発症したというのを覚えていて、若い人でも罹り得るということは知っていました。

続きを読む

依然として高まり続ける「データサイエンティスト」への関心と、それを追う「データエンジニア」と

今回の記事はいつものようにネタが見つからなくて困ったので窮余の一策としての与太話です。話題はこのブログで時々やっている「データサイエンティスト&関連職に関するGoogle Trendsを用いた意識調査」です。


ちなみに、某協会が学生向けのアンケートで意識調査を行った結果が最近報じられていて、SEやコンサルタントなど他職種と比べた場合にどれくらいの立ち位置にあるかの参考になるかもしれません。

続きを読む