渋谷駅前で働くデータサイエンティストのブログ

元祖「六本木で働くデータサイエンティスト」です / 道玄坂→銀座→東京→六本木→渋谷駅前

「データサイエンティスト」「人工知能」「AI(トピックス)」のGoogleトレンドから向こう1年間のブーム動向を占ってみる

f:id:TJO:20190319173654p:plain
(Google Trends)

最近時系列分析あまりやってないので、{bsts}の使い方を思い出しがてらついでに与太記事を書いてみます。お題は「データサイエンティスト」「人工知能」「AI(トピックス)」のGoogleトレンドから見る今後のブーム動向です。今回は互いに相互作用がないものとみなして、VARモデルではなく全て個々の時系列の単変量モデルでやります。



なお互いに相互作用があるケースを想定した分析については、1年半前のこちらの記事をご覧ください。ただし現在のデータで同じことをやったら違う結果になると思われます。




また{bsts}パッケージの使い方とその背景にある理論については僕が書いた以前の記事と、id:ill-identifiedさんの記事が分かりやすいかと思います。


{bsts}でそれぞれのGoogleトレンドの向こう1年間の予測をしてみる



ここからが本編。まず元データとして2012年6月1日〜2019年3月19日のmonthlyのGoogleトレンド検索結果を持ってくることにします。お互いのクエリボリューム規模が異なるために規模の小さいクエリの値が潰れてしまうため、実際に分析するデータは各クエリごとに取ってきます。面倒だという方のためにGitHubに"googletrends_*.csv"という名前で置いておきましたので、ご所望の方はそちらからどうぞ。


まずは「データサイエンティスト」から。モデルはシンプルな共変量なしの単変量ローカルレベル+ローカル線形トレンドで、以下も同様。

library(bsts)
d <- read.csv('googletrends_datascientist.csv')
y <- d$queries
ss <- AddLocalLevel(list(), y)
ss <- AddLocalLinearTrend(ss, y)
fit <- bsts(y, ss, niter = 500)
pred <- predict(fit, horizon = 12, burn = 100)
plot(fit, xlim = c(1, 94), ylim = c(0, 150), xlab = '', ylab = '',
     main = 'データサイエンティスト')par(new = T)
plot(pred, ylim = c(0, 150))

f:id:TJO:20190319174816p:plain
紆余曲折はあったものの、今後1年間も右肩上がりで伸び続けるだろうという予測になっています。


次に「人工知能」。

d <- read.csv('googletrends_AI_JP.csv')
y <- d$queries
ss <- AddLocalLevel(list(), y)
ss <- AddLocalLinearTrend(ss, y)
fit <- bsts(y, ss, niter = 500)
pred <- predict(fit, horizon = 12, burn = 100)
plot(fit, xlim = c(1, 94), ylim = c(0, 150), xlab = '', ylab = '',
     main = '人工知能')
par(new = T)
plot(pred, ylim = c(0, 150))

f:id:TJO:20190319174944p:plain
豈に図らんや、この空前のブームにもかかわらず「人工知能」は減少傾向だということになっています。


ところで、Googleトレンドにはそのものズバリの検索ワードだけでなく「関連ワードも含めたトピックス全体」のトレンドを見る機能があります。その中に "Artificial Intelligence" の項目があるので、そちらを見てみましょう。

d <- read.csv('googletrends_AI_topics.csv')
y <- d$queries
ss <- AddLocalLevel(list(), y)
ss <- AddLocalLinearTrend(ss, y)
fit <- bsts(y, ss, niter = 500)
pred <- predict(fit, horizon = 12, burn = 100)
plot(fit, xlim = c(1, 94), ylim = c(0, 150), xlab = '', ylab = '',
     main = 'AI(トピック)')
par(new = T)
plot(pred, ylim = c(0, 150))

f:id:TJO:20190319175102p:plain
こちらはおそらく「AI」などの検索ワードを含む関係なのでしょうが、この先1年間もぐんぐん伸びていくだろうという予測になっています。一つ前の結果と併せると、「人工知能」ではなく「AI」で検索する人が急増しているということのように読み取れます。


感想など


「データサイエンティスト」が意外としぶといな、というのが率直な感想です。{bsts}で推定した真の値を信じるならば、既に今の勢いは2013年の第一次ブームの頃のピークをも既に超えているということになるわけで、案外これはハイプ・サイクルで言うところの「定着期」に到達したのかもしれないという印象があります。



もっとも現在でも「なんちゃって」データサイエンティストが後を絶たない状況には変わりがないようにも見えますので、このブームもいつ何時萎むか分かったものではないというのが個人的な意見です。少なくとも今後も安泰だなんてことはあり得ないと思うべきでしょう。


一方、後二者は「人工知能」から「AI」への移行が透けて見える結果となりました。もっともこれは無理からぬことで、「人工知能」のGoogleニュース検索結果が50万件であるのに対して「AI」では6億5000万件にも上ります*1。社会全体で「AI」への傾倒が急速に強まり、その勢いが今後も延々と続くということが見込まれます。


その意味では「人工知能」改め「AI」はハイプ・サイクルの流行期の山をまだまだ昇り続けている模様ですが、果たしていつ幻滅期に突入するんでしょうか? 今回の結果からは、その兆候はまだ見えていないように感じます。。。が、盛者必衰の理があるようにこの過熱したブームもいつかは終わりが来るはず。それがいつになりそうかが見えてきたら、また記事にまとめてみようと思います。

*1:他の人工知能 = AIとは関係ないものも多数含まれる模様なので単純比較は出来ませんが