渋谷駅前で働くデータサイエンティストのブログ

元祖「六本木で働くデータサイエンティスト」です / 道玄坂→銀座→東京→六本木→渋谷駅前

ヒトだからこそ価値を出せる余地は、AIやデータサイエンスの「外側」の本質への関わり方にある

恒例の年末振り返り記事ですが、もうタイトルが示す通りです。例年通りであれば淡々と1年間の業界動向や個人的な学び、はたまたちょっとした私事などを綴るのですが、今年はたまたま良いお題がやってきたのでまず最初にその話を書こうと思います。

生成AIの爆発的な普及と、それに伴って生じた課題


今年は多くの生成AIプロダクトが公開され普及し、それに伴い文字通り正真正銘空前の生成AIブームが到来し、個人や企業のみならず霞ヶ関までもが、そしてついには政府与党までもがこぞって「生成AIの活用」を模索して立ち回るという有様になりました。書店に行けば生成AI関連書籍が棚一面を埋め尽くすという大盛況で、毎日のようにどこそこの大企業が生成AIを導入した〇〇サービスを公開したというようなニュースが流れ、僕が毎晩見ているテレ東WBSでもいつの間にかAI特集なるコーナーが常設されており、今やAIの話題をお茶の間で目にしない日はないという有様です。


ところが、つい先日大変に興味深い事例が公になりちょっとした議論を呼んでいるようです。この記事では当該事例そのものの詳細には踏み込みませんが、生成AIの飛躍的な発展に対して「AIの利活用」という普遍的なテーマにおける普遍的な問題は今も変わらないのだなという感想を抱きました。


これは以前にも指摘した論点ですが、ヒトは場面ごとに応じて「確率論的挙動」*1と「決定論的挙動」*2とを使い分けられる一方で、いわゆるAI(に限らず統計的学習モデル全般)はそれ自体が内在する性質として「確率論的挙動」しか本質的には出来ないんですよね*3。なので、例えば何がしかのルールや規則のような「ロジカルにルールベースで100%厳密に定められ得る」ものを判断する課題はヒトなら100%近い精度でこなせる(単に既定のルールを思い出せれば良いので)わけですが、これを生成AIにやらせるとhallucinationが混じったりして100%近くまでには届かないということは幾らでもあり得る話だと思います。


一方で、AIはヒトとは異なり計算機で動くものなので、基本的には疲れ知らずで24時間365日無尽蔵に稼働できますし、計算リソースさえ確保できれば幾らでも並行して同時に処理させることができます。よって、単純に考えればAIを導入するならばまずは「スケーラビリティ」「省力化」を旗印にした方が良いと思われるわけです。しかしながら、上記リンク記事のケースでは省力化を超えるKPIとして「精度」をステークホルダーから最重要視された結果として、不採用になってしまったという印象があります(もっとも実際の導入に際しての議論や打ち合わせでは他にも多種多様なトピックスが話し合われたのだろうと想像しますが)。


ちなみに、僕の鉄板の持ちネタの一つに以下の伝聞譚があるんですが、今回の件は概ねこれと似たような構図だと感じています。

昔、ある現場で人手(つまり人力)でこなしているマーケティング運用業務をAI*4に代替させようという話が持ち上がり、どちらの方が効率が良いかを3日間実験して検証することになった。そしていざ実験してみたところ、AIは期待通りのパフォーマンスを見せたが、一方で人力チームは3連続徹夜で猛烈に運用業務をこなした結果AIのパフォーマンスを凌駕してみせたので、結果としてAI導入は却下された

このケースでは、確かにヒト(人力運用)の方がAIをパフォーマンスで上回ったので、AI導入は却下されています。しかしながら、その代償としてヒトの方は3連続徹夜という通常ならあり得ない*5オペレーションを強いられているわけで、そもそも比較するものが不適切なんですよね。けれども、一般に「ヒトの仕事をAIに代替させる」というのは感情的な反発を生みがちなものです。なればこそ、「ヒトが納得できる」比較軸を用意する必要があるということだと考える次第です。


ただ、それだけでは「100%の精度を出せないAI」という問題の根本解決にはならないので、そこは工夫を凝らす必要があります。最も確実なのは「ヒトによる最終チェック」を挟むという手ですが、これはヒトの省力化が目的の場合は限界というかリソース上限が必ず付き纏うため常にベストとは限りません。案外、完璧なルールベースのシステムを裏でベタっと組んでおいて*6、そこの入出力をuser friendlyなものにrewriteする目的で生成AIを使う方が堅実なのかもしれません。


結局のところ、そもそも100%近い決定論的挙動に近い精度を生成AIに要求する方が無理があるという話で、やはり「必ずしも正解でなくても良い試行錯誤的なもの」の「省力化」のために生成AIを使うというのが現状での最適解なのでしょう。実際に「ひたすら大量のアイデア出しをするための要員数十名を生成AIで代替させた」という事例が既にあるわけで*7、最終的には「何のために生成AIを使うのか」という課題設定こそが最も大切だと言えそうです。


AIやデータサイエンスの「外側」の本質にアプローチするのが、ヒトのなすべき仕事


私事ながら、今年に入ってからアカデミアの世界を離れて企業にapplied scientistとして転職された方とお話をする機会がつい先日あったのですが、その方のお話される内容があまりにも深く、かつ僕自身の今現在のチームにおける仕事のやり方と共通するところが非常に多く、大変に感銘を受けたのでした。


その方のお話で最も興味深かったのが「あらゆる課題解決系のプロジェクト案件において『そもそもの課題設定』のところから積極的に口出ししていっている」という点でした。それ自体はビジネスパーソンとしては当然望ましいスタンスですが、面白かったのが「自身の専門スキルをあえて使わなくても済むようにビジネス課題を整理している」というお話。ご自身のexpertiseはそれ単体で素晴らしい専門書が一冊書けるくらい*8に抜きん出た価値がおありなのですが、それを「あえて使わない」と仰るんですね。その理由として「そんな高度な手法を使うとベストであっても非現実的で極端な解に帰着してしまうことがあるので、むしろビジネス要件の側を綺麗に整理してそちらの制約条件を全部満たすようにすることを優先している」という趣旨のことを仰っていたのが印象的でした。「伝家の宝刀は抜かないことに価値がある」とも仰っていて、唸らされましたね。


ところで、これは実に極めて普遍的に重要な真理を突いた議論だと、僕個人は考えています。結局のところ、

  • 「その実課題において何を真に解決すべきか」という本質は、大抵の場合AIやデータサイエンスが扱う領域の「外側」にある
  • 故に何かしらの実課題をAIやデータサイエンスで解決したかったら、AIやデータサイエンスを知悉した専門家が率先してその「外側」に踏み出して、本質的なところへとアプローチし、AIやデータサイエンスで解決可能な形に変換する必要がある

ということなんですよね。「そんなのずっと前から常識じゃん」「データサイエンス力には『ビジネス力』も含まれる*9んだから当然だろ」と言われそうですが、以下でもうちょっと突っ込んだ議論をしてみようと思います。


ここで気を付けたいポイントとして、「AIやデータサイエンスが扱う領域の『外側』と『内側』」というのは、字面だけ見ると上のような構図を想像しがちなんですよね。とりあえずビジネス課題が定められていて、それに対してビジネス上の解決可能範囲が設定され、その中にAIやデータサイエンスで解決できるパートが含まれている、というものです。よって、データサイエンティストや機械学習エンジニアはこのパートだけきっちりこなせば、自然とビジネス課題も解決されるということが期待されます。実際に、そのようなスタンスで仕事をしている人はビジネス側にもAI・データサイエンス側にも多いのではないでしょうか。お互いに「自分の持ち場のことだけやっていれば良い」という。


ところが、実際のビジネス実務におけるデータ分析の現場では、むしろ上のような構図であることの方が多いという印象があります。


これは完全に図が表している通りで、本質的なビジネス課題設定という「杭基礎」があり*10、その上にビジネスオペレーションの中で達成可能な解という「箱」が載せられ、さらにその上にさらなる高みを目指した結果としてAIやデータサイエンスによる高度な解という「塔」が載せられる、という図式になっていることが大半だと思うのです。そして、AIやデータサイエンスの出番がある時は、往々にしてステークホルダーたちによる「もっと高く建てたい」という願望がある場合だったりするのです。


ここまで来ればもはや明確でしょう。一番下の基礎のところがフラフラしていたら、その上の全ての構造は極めて脆弱になり、「塔」を高く建てるどころか「箱」すら倒れかねないはずです。なればこそ、真に成果を出したいデータサイエンティストがやるべきはまず「全てが上に乗っかる大事な基礎の工事を他人事と放置せず自らベストなやり方を追求しに行く」ことなのだと思うのです。高い「塔」を建てたければ、何よりも「基礎」をそれに耐えられる頑丈で堅牢なものにしていく必要があるというお話ですね*11


例えばこれは広告・マーケティング分野であれば「KPIに何を置くか」「何を最適化したいのか(メディア予算配分なのかそれともメディアクリエイティブなのかetc.)」「精度を上げたいのかそれとも省力化したいのか」「予算配分を最適化するなら浮いた予算で何をしたいのか」といった、ビジネス戦略上の課題設定の根本的な部分に当たると思われます。そしてそれは、きちんと定めることによってまずビジネスオペレーションとして何をすべきかという課題に変換され、その課題がさらにもう一段上がってAI・データサイエンスによって解決可能な課題へと変換される……というプロセスを経て、最終的に解かれることが期待されるというわけです。


このプロセスの中には、ちょっと前の記事で指摘したような「データセットの本質的な性質を踏まえた分析を行う」という話も含まれると個人的には考えます。というのも、分析プロジェクトの類を立ち上げるに当たって最もクリティカルになるのが「得られるサンプルやデータセットはそのビジネス自体の仕組みや性質に依存する」という点だからです。


例えば、自動車や不動産のような「商品の存在を知ってから長い検討期間を経て最終的に購入が決断される」というタイプのビジネスでは、広告やマーケティングによる「刺激→反応」パラダイムを前提とした分析は不向きです。また、スポーツドリンクや新入生向けグッズのような「特定の期間に売り上げがほぼ全て集中するため広告もマーケティング施策もそこにほぼ全て集中されている」タイプのseasonalityが極端に強いビジネスでは、そもそも一般的な統計分析手法では要因間で影響を分離するのは至難の業です。故に、これらのケースでは「どのような分析をすればそのビジネスから生成され得るサンプルやデータセットを活用できて尚且つビジネス上有益な意思決定に繋げられるか」という、まさしく「基礎工事」のところからアプローチしていかないと殆ど意味がないのです。


しかしながら現実のビジネスというのは恐ろしいもので、いつの間にかビジネス側で課題設定が既にトップダウンで決められていたり*12、あまつさえそのAIやデータサイエンスによる解の候補までもが「既に関係各方面の全部署と擦り合わせて合意済み」として絞り込まれた後だったりするんですよね。そうして既定路線となったアプローチが、実際には「やっても無駄なもの」だったならば……というケースは僕の記憶にある範囲だけでも枚挙に遑がありません。


ではどうするべきなんでしょうか? 例えば、前者のようなケースでは「購入までのファネル構造の最上部に位置する指標*13」をKPIとしたデータ取得&分析を改めて検討したり、後者のようなケースでは過去の売り上げや実施済み広告・マーケティング施策といった既存データへのretrospectiveな分析ではなく積極的な施策介入を伴うマーケティング実験を改めて提案する、といったアプローチが考えられます。そこで改めて、最終的なビジネス戦略上の意思決定に至るまでのプロセスを再検討すれば、ある程度の目処がつくというものかなと。そして、そういう「出来ないことは出来ないときちんとジャッジする」、さらには「既定路線をひっくり返してでもより適切なアプローチを提案する」仕事こそ、「基礎」だけでなく「塔」まで全体像を俯瞰できるデータサイエンティストがやるべきことなのです。


そのように考えれば、これはデータサイエンティストに限った話ではなく、機械学習エンジニア・ソフトウェアエンジニア・クリエイティブデザイナーなどなど、ありとあらゆる専門職がビジネス課題に取り組む際に遍く当てはまる話だと言っても過言ではないでしょう。「専門職だからビジネスサイドのことはノータッチ」と無関心を決め込まず、専門職として成果を上げるためにこそ「何事も他人事にしない」姿勢が重要なんですね。つまり全ての基礎たるビジネス戦略上の課題設定そのものを「専門職の自分が成果を上げやすいように」働きかけて変えていく、まさしく基礎工事そのものへと関わっていくという動き方が必要なのでしょう。それは、最後の「塔」の建て方まで知悉する専門職にしか出来ないことなのです。あえて言えば、それこそが専門家として持つべきthought leadershipというものなのかもしれません。


上述した生成AIシステムの導入が見送られた一件も、開発者側がもっと「基礎工事へのアプローチ」をしっかり密にやって課題設定そのものを適切な形に変えられていたならば、もしかしたらスムーズに導入に漕ぎつけられたのかもしれないわけです。裏を返せば、生成AIそのものだけではそこを突破することは難しかったということなのでしょう。


ここで論じたような「ヒトの意思決定」のプロセス全体に関わっていく「戦略的」なコミュニケーションは、しばらく先の未来においてどうなるかは分かりませんが*14、少なくとも直近の生成AIたちにはまだまだ難しい代物だと思われます。そこにこそ、今後もヒトの専門職だからこそ価値を出せる余地があるはずだと僕は信じています。


最後に、改めて年末の振り返りを


仕事という点では内輪ネタで恐縮ですが、今年は僕にしては珍しく本業である広告戦略データ分析が貢献したプロジェクトが評価されて、年末に開催された2つの社内コンペで上位に食い込むことが出来たのでした*15。これは完全に手前味噌ですが、少なくともそのうち1件については上述したような「基礎工事へのアプローチ」が我ながらある程度出来たという自負があり、そこも評価してもらえたのかなと勝手ながら感じております。


また、今年はその「基礎工事へのアプローチ」を積極的に試みてプロジェクトの進行をスムーズにさせることが出来た案件が他にも複数あり、今後もそういう動き方をどんどん増やしていこうと目論んでいるところです。そういう意味では、偶然現職のsales orgに迷い込んだ僕も8年近くの時を経て、ようやくいっぱしのsales contributorらしくなってきたということなのかもしれません。


プライベートでは、今年はコロナ禍&DVT*16罹患を経て実に3年ぶりとなる海外渡航を果たしたのでした。もっともグアムという時差もほぼなければフライトも3時間余りしかかからない近場だったので、本格的な海外渡航再開はやはり時差が大きくフライトも7時間以上ぐらいかかるところに行ってきてから*17、ということになりそうです。個人的にはやはり大好きなシンガポール辺りに出張などで行きたいのですが、こればっかりは業務の都合もあったりするので何とも言えない感じですね。いずれにせよ、またコロナ禍前のようにちょくちょく海外を飛び回るようなアクティブな日々に戻れればと願っております。


もっとも、45歳を越してアラフィフに差し掛かってきたということもあり、身体のあちこちに些細な不調が出ることが日常茶飯事となってきており、「若い頃はこんなことで悩まされなかったのになぁ」ということが最近は多いです。細かい話をすると、以前はやらなくても大丈夫だった前腕のトレーニングを怠っていたら、昔は出来ていたはずのトレーニング動作が出来なくなっていました(泣)。こういう「老い」にも抗いながら、これからも仕事に趣味にと頑張って取り組んでいく所存です。


最後に、この年末は久々の大仕事を手掛ける機会がありましたので、特に何事もなければ年明け1月のうちには何がしかの公開事例をご覧に入れられるかと思います。傍からは穀潰しのように見えるかもしれませんがちゃんと仕事もしていますよ、というアピールも個人的には兼ねていますので(笑)、是非ご笑覧いただければ幸いです。


それでは皆様、良いお年を! また来年も引き続きよろしくお願いいたします。

<余談>


冒頭のイメージはStable Diffusion XLにこの記事のタイトルを読み込ませて生成したものです。去年の年末振り返り記事で生成したイメージよりも出来が良い気がしますね(笑)。これもまた生成AIの1年分の進歩の恩恵に与ったということなのかもしれません。

*1:思考とか感情とか「お気持ち」とか

*2:記憶された事実とか定められたルールとか「常識」とか

*3:要はデータに基づいて学習して〇〇である「確率」をアウトプットする代物で、確定的なアウトプットを出すようにはなっていないというお話

*4:当時なのでどちらかというとML即ち機械学習システム

*5:これが通常運行の会社も世の中に存在することは十分承知しております()

*6:こっちの方がしんどそう

*7:ChatGPTで広告会社の組織激変、サイバーでは30人以上いたディレクターがゼロに | 日経クロステック(xTECH)

*8:実際に出版されて僕は一冊ご恵贈いただいています

*9:ナントカ協会の例のアレです

*10:建築・建設分野にはド素人ゆえ喩えが間違っていたら何卒ご容赦ください

*11:そう言えば高層ビルを建てる時に長期間かけて基礎を作っているところを八重洲で見たことがあります

*12:極端なケースでは役員会の決定として降りてきていたりする

*13:ブランド認知など

*14:例えばLLM Multi Agent辺りのアプローチで10年ぐらいしたらもしかしたらある程度は行けるかも?という気はしますが

*15:どちらもお客様の機密保持義務があり公には出来ない案件なので外部メディアには出ていませんが、その「結果」についての記事は微妙に外部に出ています

*16:深部静脈血栓症

*17:DVT治療薬のイグザレルトの服用タイミングという課題があるので