ICC KYOTO 2024のセッション「AIの最新ソリューションや技術トレンドを徹底解説(シーズン7)」、全11回の⑧は、NSV Wolf Capital 柴田 尚樹さんが、今一番米国でホットな、自律的に物事を実行する「Autonomous AI Agent」を紹介。続いてAIが持つ「生成(Generation)」以外の能力、「理解(Comprehension)」について、セキュリティカメラ会社を例にとり解説します。ぜひご覧ください!
ICCサミットは「ともに学び、ともに産業を創る。」ための場です。そして参加者同士が朝から晩まで真剣に学び合い、交流します。次回ICCサミット FUKUOKA 2025は、2025年2月17日〜 2月20日 福岡市での開催を予定しております。参加登録は公式ページをご覧ください。
本セッションのオフィシャルサポーターは Notion です。
▼
【登壇者情報】
2024年9月2〜5日開催
ICC KYOTO 2024
Session 11C
AIの最新ソリューションや技術トレンドを徹底解説(シーズン7)
Supported by Notion
(スピーカー)
青木 俊介
チューリング株式会社
取締役 共同創業者
柴田 尚樹
NSV Wolf Capital
Partner
砂金 信一郎
Gen-AX株式会社
代表取締役社長 CEO
山崎 はずむ
株式会社Poetics
代表取締役
(リングサイド席)
上地 練
株式会社Solafune
代表取締役CEO
小田島 春樹
有限会社ゑびや / 株式会社EBILAB
代表取締役社長
柴戸 純也
株式会社リンクアンドモチベーション
執行役員
武藤 悠輔
株式会社 ALGO ARTIS
取締役 VPoE
(モデレーター)
尾原 和啓
IT批評家
▲
▶「AIの最新ソリューションや技術トレンドを徹底解説(シーズン7)」の配信済み記事一覧
自律的に物事を実行するAutonomous AI Agent
柴田 Autonomous AI Agentは、自律的に物事を実行できるAgentです。
とにかく今一番アメリカでホットなのはAgentで、Copilotは一通りだいたい終わっています。
このDevinは結構すごくて、見たことがある方もいると思います。
尾原 (動画を見ながら)入れたものを、1回どういう工程でやるか分解します。
ツールの中に、コードを書くものやプロトタイピングを見るものなどのパーツがあるので、一つひとつのAgentがパーツを呼び出して、プログラムを書いてエラーが出ます。
でもそのエラーを、レビュアーというAgentが解釈して、デバッグしたものも再実行したらまたエラーのパラメーターが出てくるので、それをチューニングします。
そして、視覚化を含めたプログラムのコードとウェブサイトができます。
Autonomous AI Agentの性能
柴田 解説ありがとうございます。
タスクを自然文で、例えば「こういうウェブサイト、モバイルアプリを作ってください」みたいな指示を出すと、AIがサブタスクに分解して、どんどんデバッグをしながら作ってくれる、そういう世界が来ようとしています。
それでは、どこまでできているのかというと、まだ全然完璧ではなくて、この数字はGitHubにあるイシューをAIがどのぐらい解決できるかという数字です。
今、Devinはもちろん他のLLMより断然良いのですが、それでも14%で、86%はまだ解決できないので、人間の天才エンジニアほどはまだできませんが、徐々にそちら側にもう向かっています。
勘の良い方はお気づきいただけると思いますが、数カ月毎にどんどん性能が良くなっていくのが今の生成AIです。
今もうここまで来ているので、半年後のICCサミットの頃には、また違う数字になっているのかなという気がします。
あともう一つは、カスタマーサポートの自動化に取り組んでいるSierraという会社があって、会社を作ったのはセールスフォース前CEOのブレット・テイラーです。
彼はFacebookの元CTOでもあるのですが、SierraはAI Agentをたくさん作っています。
あるConsumer Goodsのお客様に導入した例では、ゴール目標は5段階評価でAIが4.75の顧客満足度を得ることです。
人間がカスタマーサポートをやると、顧客満足度は4.5らしいのです。
今のところAI Agentで6割は解決できていますが、逆に言うと4割はまだ解決できていません。
ですからまだ完璧ということにはなりませんが、こういう方向に今トレンドがどんどん向かっています。
まさに先ほどのお話ではないですが、音声の対応がキーになるという話と、おそらく最初は、人間のカスタマーサポートが働いていない夜の時間などの付加サービスとして顧客に提供するのではないかという話です。
AIをどのように導入していくかという進化のフローでいくと、アメリカの早い会社はFine Tuningに入って、Agentを入れているところもありますし、日本は多分若干時間差があると思うので、今年(2024年)はRAGをやったり、早ければFine Tuningに入る感じかなと思います。
Generation(生成)vs Comprehension(理解)
柴田 今日は、この話を皆さんに覚えて帰っていただきたいと思います。
尾原 はい、覚えて帰りましょう!
柴田 ということで、Generation vs Comprehension(生成 vs 理解)について話をしたいと思います。
生成AIの「生成」は「Generative」で、皆さん、テキストや画像、動画などを生成するものだと思いますよね。
もちろんそれは得意ですが、最近どうも見ていると、「Comprehension」、つまり現状、物事を「理解」するほうに生成AIを使うと、特にB2Bの業務利用ケースでうまくいく場合が多いと思います。
尾原 チューリングの運転も、Poeticsも理解から始まりますよね。
柴田 はい。生成する前に、例えば、車で走る時に目の前に何があるかということを深く理解できると、当然運転を失敗する可能性が低くなるわけです。
営業もそうだと思うのです。
営業でお客様が何を言っている、どういう感情なのかを深く理解できると、当然その後のアクションがうまくいきやすくなります。
ですから、理解するほうに生成AIを使います。
名前が誤解を生みやすいと思いますが、Generative AIは皆さん、何か生成するものだと思ってしまいますが、そうではなくて、マルチモーダルが今すごく発達していて、かなりComprehensionのほうも良いよという話です。
生成AIをComprehensionで活用する例
柴田 これは僕が個人で投資した会社でSpot AIという会社ですが、セキュリティカメラの会社です。
セキュリティカメラの会社は、昔からずっとありますよね。
昔の運用は、セキュリティカメラを見ているガードマンが控室にいてずっとカメラを見ていないと、何が起こったかわからなかったり、何かトラブルが起きた時に何時何分に起こったか誰もわからないので、ビデオを巻き戻して確認しなければいけませんでした。
生成AIを使うと、それぞれの瞬間にどういうことが起こっていたのかAIがタグ付けできるので、リアルタイムに見ていなくてもいいですし、特定のある決めたことが起こったらアラートを出すこともできます。
もちろん、どのぐらいの人がどのぐらいの時間、店にいるかもデータが取れますし、統計も取れます。
何か事故が起こってしまったシーンだけを探したい場合には、当然検索ができるのです。
AIが何時何分に何が起こっていたかを理解してくれます。
これはセキュリティカメラの宣伝をしたいわけではないのですが、今まで人間が膨大な時間と手間をかけてやらなければいけなかった「理解をする」という行為を、AIにやらせることで効率化できるシーンが、多分皆さんの業務の中にもたくさんあると思います。
このように考えていただくと、少しはAIの活用が広がるのかなと思います。
LLMの現状についてお話しします。
先ほどから出している「偏差値75の東大卒の新人」という例えがすごく好きなのですが、一般常識を豊富に持っているのですよ。
文章も画像も動画もかなり理解できます。
ただし、特定業界の特定業務の知識はないのですよね。
ここさえきちんとトレーニングしてあげれば、B2Bではかなり使えるようになるというのが、ここ半年、1年ぐらい私がアメリカで見ているケースですね。
生成AIの活用はComprehension、Generationの順で
柴田 先ほど申し上げた通りですが、右側のComprehension(理解)を先にやりましょう。
何が起こっているかをまずAIにきちんと理解してもらって、その上で必要なら生成をするというふうにすることで、より活用の幅が広がるのではないかと思います。
駆け足でしたが、私のプレゼンは以上です。
尾原 ありがとうございます。
あと時間が30分ほどになってきました。
柴田さんがフレームワークしたことを、まさに砂金さんが企業向けに実践しているので、砂金さんに先にプレゼンしていただいて、全体でディスカッションしたほうが盛り上がると思うので、砂金さんのプレゼンからお願いします。
(続)
本セッション記事一覧
- AIでEnd-to-endが主流になってきた自動運転技術
- 自動運転車のチューリングが挑む「何が起こるか」を予測できる生成AI
- エッジ生成AIのキラーアプリケーションは自動運転
- AIを作ることは「人間とは何か」という大きな問いを解決しようとすること
- リアルタイム音声認識「Poetics Speech API」が日本語では最高性能レベルの理由
- 人間は生まれながらにEnd-to-endでマルチモーダル
- 日本企業がLLMアプリ、AIを導入する流れを解説
- 自律的に物事を実行する「Autonomous AI Agent」とは
- 最先端のコールセンターを自律AIで構築する試み
- ソフトバンクの子会社「Gen-AX」が展望する企業向けエージェント、2026年までのロードマップ
- 2025年の生成AIはどうなる? 未来を信じて新たな産業を創ろう!【終】
編集チーム:小林 雅/原口 史帆/浅郷 浩子/戸田 秀成/小林 弘美