渋谷駅前で働くデータサイエンティストのブログ

元祖「六本木で働くデータサイエンティスト」です / 道玄坂→銀座→東京→六本木→渋谷駅前

「データを集める前にデータ分析責任者(データサイエンティスト)を雇うべき」理由とは

f:id:TJO:20160716180212j:plain
(Image by Pixabay)

先日こんな記事が注目を集めていたのを見かけたのでした。

ここで大事なのは、データ集めは非常に大事なステップですが、最初の0.8歩に過ぎないということです。データ解析やAI技術導入の準備に時間をかけすぎていて、「やっとビッグデータが溜まった」と思ったときにデータサイエンティストに大量のデータを丸投げする、というプロセスは非効率的なのです。


それよりも、最初の段階からデータサイエンティストを交えて、ゴールを志向しながら逆算的アプローチでデータを収集、解析した方が良い結果が確実に出ます。

これはもう、日本のデータ分析業界で色々な現場の話を見聞してきた日本で働くデータサイエンティストの身としては、耳が痛いを通り越して耳から血を噴きそうな話です。にもかかわらず、こういう話をデータ分析業界「以外」の人たちに話してもなかなかピンと来ない人が多いのか「?」という顔をされがちなのが現状です。


ということで最近与太記事が続いていて恐縮なのですが、今回も「何故データを集める前にデータサイエンティストを雇うべきなのか」という与太記事を書いてみようと思います。

続きを読む

機械学習をやる上で必要な数学とは、どの分野のどのレベルの話なのか(数学が大の苦手な人間バージョン)

しばらく前にこんな記事が出ていたのをお見かけしました。

明らかにこれは僕が某所(笑)で適当に放言したことがきっかけで巻き起こった議論の一旦なのではないかと思うのですが、個人的にはこちらの@さんの仰る通りで大体良いのではないかと考えております。


なのですが、言い出しっぺらしき身としてはもうちょっと何か具体的な話を書いた方が良いのかな?とも思いましたので、常々公言しているように数学が大の苦手な身ながらどの分野のどのレベルの数学が機械学習をやっていく上で必要なのかという点について戯言だらけの駄文を書いてみることにします。


深層学習 (機械学習プロフェッショナルシリーズ)

深層学習 (機械学習プロフェッショナルシリーズ)

ちなみに、以下に並べる戯言は深層学習青本から得られた知識をベースにしています。何度でも書いておきますが、僕は機械学習の理論的な側面についてはほぼど素人なのでそこだけはご承知おきください。。。間違っている部分があったらガンガンご指摘いただけると有難いですm(_ _)m*1

*1:添え字がおかしいとかは直すのも面倒なので、雰囲気を出しただけということで何卒ご容赦を。。。

続きを読む

データサイエンティスト含むデータ分析職の仕事がつらい4つの理由:洋の東西を問わずつらみは同じらしい

f:id:TJO:20180402144911p:plain
(Image by Pixabay)

某所でバズっていたこの記事ですが。

もう読んだ瞬間に「うわー、これ完全に洋の東西を問わずデータ分析業界だとどこでも見られる、業界つらみあるあるだなー」という感が湧いてきて、こみ上げてくる涙が押さえきれませんでした(嘘)。という軽口はさておき、実際にほぼ同じ内容の愚痴をUSでデータサイエンティストとして働いていた知人からも直に聞いたことがあるので、個人的にもかなり説得力のある話だなと思いました。


この記事の若干嫌なところは「データサイエンティストたちはいつでも転職活動をしている、何故ならどこの職場に行っても以下のつらみがあるからだ」という書き方をしている点。いや、データサイエンティスト含むデータ分析職が全員常に転職活動しているかというとさすがに違うだろうと思いますが、「それくらいつらいんですマジ勘弁して下さい」と言われたら頷かざるを得ないのもまた事実かなと。

続きを読む