▶カタパルトの結果速報、ICCサミットの最新情報は公式Twitterをぜひご覧ください!
▶新着記事を公式LINEで配信しています。友だち申請はこちらから!
▶過去のカタパルトライブ中継のアーカイブも見られます! ICCのYouTubeチャンネルはこちらから!
ICC FUKUOKA 2023のセッション「解説・雑談シリーズ テクノロジーはどこまで進化するのか?(シーズン7) 」、全8回の⑤は、大量のデータを扱うようになった昨今の課題からディスカッションがスタート。話題はChatGPTの活用編に発展します。果たしてこの進化は人間から仕事を奪うのか? 人口の減る日本に寄り添うのか? ぜひご覧ください!
ICCサミットは「ともに学び、ともに産業を創る。」ための場です。そして参加者同士が朝から晩まで真剣に議論し、学び合うエクストリーム・カンファレンスです。次回ICCサミット KYOTO 2023は、2023年9月4日〜 9月7日 京都市での開催を予定しております。参加登録は公式ページをご覧ください。
本セッションのオフィシャルサポーターは エッグフォワード です。
▼
【登壇者情報】
2023年2月13〜16日開催
ICC FUKUOKA 2023
Session 9G
解説・雑談シリーズ 「テクノロジーはどこまで進化するのか?」(シーズン7)
Supported by エッグフォワード
▲
▶「解説・雑談シリーズ テクノロジーはどこまで進化するのか?(シーズン7)」の配信済み記事一覧
日本のデータ管理運用に求められるもの
砂金 日本語の話をちょっとしていいですか?
西脇 どうぞ。
砂金 さっき食材などのデータがそんなに無いという話(Part.4参照)がありましたよね。
ワインはあるんだけれど日本酒は無いというのは、致命的ですよね。
今後お酒というマーケットで、日本酒はもしかしたら潜在的なポテンシャルがワイン以上にあるかもしれないのに、お酒プリンタなるものが発明された上で、ワインや洋酒だったら無限に作れるのに、「日本酒って分からないから作れないんだよね、じゃあ流行らないね」みたいな感じになると、非常によろしくない。
今我々がこうやって話している日本語も、おそらく1億人しか話していなくて、80億分の1の言語となると、MicrosoftやGoogleからすると、メインの開発言語とはならないと思います。
その中で、LLM(大規模言語モデル)を僕らが頑張って、必死になって、背伸びして、日本語ネイティブで学習させていますけれども、難しいところがあります。
▶LINE、NAVERと共同で、世界初、日本語に特化した超巨大言語モデルを開発 新規開発不要で、対話や翻訳などさまざまな日本語AIの生成を可能に 2020.11.25(LINE)
尾原 今やっぱりGPTがブレイクスルーテクノロジーだから、みんなテクノロジーのモデルの作り方のアルゴリズムのほうにばかり着目します。
でもそれは論文などでバンバン外に出ているから、モデルの作り方よりもデータがどう集まるかだったり、データがどうアップデートされ続けるかみたいなことのほうが実は大事です。
そこはやっぱり、ちゃんとユーザーがデータを出したくなる会社、というところが大事ですよね。
砂金 僕はクラウドのときの反省があります。
AzureやGCP、AWSが流行った結果、Microsoft、Google、Amazonも儲かって、それはそれでいいのですが、日本国から多分大規模なデータセンターをちゃんと管理運用するノウハウが抜け落ちましたよね。
村上 さくらインターネットくらいじゃないですか。
尾原 ほんと頑張れ。
砂金 本当にさくらさんとかに頑張ってほしいのですが、”もう1回LLMでやりますか問題“”があって、我々が作っている中でモデルを作ることには、いろいろな学びがあるんですよね。
だいたい1回のデータ投入をして失敗するまでに1カ月くらいかかるんですよ。
それを繰り返しやりながら、チューニングとかをしながら、これだったら学習が成功するというノウハウを持った人はすごく希少価値が高いのですが、日本語を扱えて、日本人で、と言うと、何人いますか?というくらい、研究者を含めて結構少ないですよね。
何かよく分からない黒魔術にするのではなくて、一応ホワイトボックス化されていて、ちゃんと教科書通りには、論文を読めば、データも集めれば、めちゃめちゃ高いスーパーコンピュータを投入すればできそうなんだけれど、それを本当にやったことがあるが人がいるかというと、「いや、ちょっと及び腰で…」という感じだと、日本が遅れてしまうかもしれないリスクがあります。
尾原 そこって、みんなイーロン・マスクが投資したからとかで、GPTを過大視し過ぎているところもあります。
GPT-3の規模感で言えば、まあフロップス(FLOPS)だけの単純計算で言えば、1回の学習は5億円ぐらいなんですよね。
だから20億〜30億円ぐらい突っ込めば、それなりのチューニングはできちゃうじゃないですか。
そこはちゃんと投資すれば、規模感はまあまあ高いけれども、ここで遅れ続けるよりは、決断を持ってやったほうがいいと思います。
生成の応用アイデア
西脇 ここから話を「応用」というところに持っていきたいと思います。
これまで、提供側の話と理論の話を主にしましたね。
今度はそれが良いものであるか悪いものであるか、精度がとか、だまされるとか、それはおいておいて、使わないといずれにしてもテクノロジーは意味がないので、使う側の立場の話にいきます。
さっきの話でChatGPTは予測や予想をしないということでした(Part.2参照)。
じゃあ何に使えるかということで、私はGenerative AIの勉強会やアイデアソンをやっているのですが、私はこんな意見を出しました。
私たちは人間ドックにいくと、いろいろなパラメータを取られますよね。
年齢、職業も分かります。
そういったことが分かる中で、最後問診で「この結果を見ると、西脇さんはこれに気をつけたほうがいいね。あとは食事に気をつけて、ちょっと運動したほうがいいかな」とか言われますが、こういうアドバイスは、ChatGPTが全部作れるんですね。
あとこれは金融機関に言ったアイデアですが、私がどのくらい預金を持っていて、株式を持っていて、どの保険に入っていて、どういう家族構成か分かると、私の遺言状と財産分与のアドバイスを書いてくれるという付加価値サービスが全部できます。
そういうふうになっていくと、確かにやっていた仕事が無くなる、例えば、証券アナリストが無くなるよねという話がありますが、そういう産業への利用に関してコメントはありますか?
仕事が奪われるということであったり、新しい仕事が生まれるんじゃないかとか、利用側の意見はありませんか?
仕組み側はいろいろあったので、皆さんは利用側についてすごく聞きたいと思います。
気軽に話せるバディとしての需要
村上 ちょうど今日、ICCサミットの美食体験で、お昼にうな善に行きました。
尾原 うな善いいなあ。
村上 はい。有難かったです。その往き帰りで話したことですが、あまりおおっぴらに人に聞けないけれど聞きたいみたいなものってありますよね。
僕は経験があって、昔パソコンインターネットからモバイルインターネットになったじゃないですか。
僕は両方ともやっていて検索もやっていたのですが、クエリーにすごく違いがあるんですよ。
ガラケーのインターネットは、iモードが出てきたときに、恋愛のクエリーが出てきて、ピークが夜中になってきました。
みんな暇だからベッドで携帯をポチポチして、友達とメールをやるようなことがすでに2000年当初に生まれていました。
その時間のクエリーは、さびしいとか感情的なもの、恋愛の話や性の話、人になかなか言えないようなコンプレックス系のものなどが出てきました。
これはパソコンではないことで、なぜならパソコンは、昼間オフィスで使う文房具だったからですよね。
さらに今友達との関係、お一人様が増えているという話がありますよね。
対話相手が身近にいないのは、社会問題になりますよね。
特に日本はなるという場合に、気軽に話せるバディとしてのChatGPT的なサムシングはすごいあるなと思っています。
そのとき話していたのは、たとえば離婚の仕方とか……
西脇 気軽には聞きづらい、あるあるですよね。
村上 どういういうふうにしたら財産分与が上手くいくのかとか、親権がどうだとか、アドバイスが欲しいとか、未上場株をこれくらい持っていて、結婚何年目で…、とか入れると、「こういうふうに最初に言ったほうがいいんじゃないですか?」みたいなものが返ってくるとかね。
西脇 ありですね。
尾原 仕事のシチュエーションに引きつけながら言うと、不安って相談できる相手がいなかったり、これをこの人に相談するのは憚られるなと抱え込んで、それでメンタルになってしまったりするわけですよね。
あとは「悩む」と「考える」には違いがあって、悩む場合は問題を分解して、こういうふうに考えればいいなんてことにたどりつかないから、悶々とするわけですよね。
GPTや生成系は分解してくれることが得意ですよね。間違うかもしれないけれど。
西脇 会話になりますからね。
村上 自分の不安が何なのか分からないというのが一番病みますから。
要は、モヤモヤがどんどん増幅してくるわけじゃないですか。
AIに求める外見は?
砂金 ちなみに臣さんの言う、その会話相手に「ガワ」は必要だと思いますか?
西脇 ああ、見た目ね。
村上 それはグッドクエスチョンだと思います。
砂金 バーチャルヒューマンっていう英語側で考えたときに、超リアルな、ハリウッド映画に出てきそうな、髪の毛までちゃんと動くようなものを必死に作ろうとしているんですけれど。
村上 Metaのメタバースみたいな感じね、脚がないけどみたいな。
砂金 我々日本人は、別にVTuberがちゃんとお客さんが取れているということは、そんな精巧な魂の入れ込んだ何かは必要なくて、適当に人的なコミュニケーションができる何かであれば、まあ。
西脇 そこに一石投じたい。
私が軽く調査したところ、海外は砂金さんが言われるように確かに素敵な人を想像させるようなAIのキャラクターにするんですよね。
日本は二極化していて、例えば、金融機関は必ずロボットみたいなキャラクターなんです。
日本は「ロボット=AI」というイメージが非常に強い。
だから銀行に聞いているのですが、向こうはロボットが話しているように見せるんですよね。
それは、いろいろな失敗をしても大丈夫だ、人間じゃないからとか、クレームがいかないからとか、いろいろな理由があって助けられているのですが、そういうイメージがすごく強い。
もしくはアニキャラ。これに二極化しています。
だから、どういうものに尋ねているかということを考えないといけないなと思うんです。
村上 金融機関系のアニキャラは必ず女性というのは、僕はすごい嫌なんですよね。
あれは明らかにジェンダーバイアスですよね。
女性行員という、いかにも昔の一般職の、制服を着た人が出てきます。
でも僕は、日本及び特に東アジア圏は人ならぬものに魂が宿ることに抵抗感が無い文化圏だと思うんですよね。
八百万の神だし、山にも神様が宿るみたいなことは、日本だけではなく中国にも韓国にもありますよね。なので、そこは何でもいいかなと。
砂金 多分バーチャルヒューマンのすごい精巧なものを、リアルタイムで遅延なく、レンダリングしながら再生するには、もう少し時間がかかる気がします。
村上さんはネコ推し
村上 だから、ここで僕が言いたいのは「ネコ」です。
西脇 ほぅ。ネコ、いいですね。
砂金 (挙手して)猫派です(笑)。
村上 インターネット上で一番人気のある動物はネコです。これはデータが証明しています。
西脇 そうです、アバターで一番多いのはネコです。
村上 なので、何か間違ったことを言っても、「まあネコだしね」「まあそうだよね」と。
西脇 そうすると、尋ねたときに「こんにちはニャー」とかなってしまうから(笑)、あまりそこに入り込むと良くないかもしれないけれど。
北川 西脇さんは家のネコに話しかけるとき、「ニャー」とつけるんですか?
西脇 そうですよ。割と「おはようニャー」って。
(一同笑)
要は人間は合わせる能力があるから、優れているんですよね。
赤ちゃんにも「お腹いっぱいでちゅか?」と言うじゃないですか。
人間って、合わせる能力がありますから。
村上 面白いのは、ネコは別に「ニャー」と話していないし、赤ちゃんも「でちゅ」とはあまり言っていないですよね。
西脇 我々が合わせています。
村上 でも合っていないんですよ、だから全然。
思い込みでしかないなというのはありますけれど。
尾原 でもごっこ遊びってすごく大事で、ごっこ遊びだから自分が普段言わないことも言うみたいなところもあるし、間違ったことやちょっと外れたことを言っても受け入れるというのがありますから。
あと1つ、Generative AIで大事なのは、西脇さんがアクセスするときはネコが出て、僕がアクセスするときはハイエナが出ても、別にいいわけですよね。
西脇 パーソナライズですね。
あと、回答によって人格が変わってもいいし、文脈によって変わってもいいですしね。
(続)
▶カタパルトの結果速報、ICCサミットの最新情報は公式Twitterをぜひご覧ください!
▶新着記事を公式LINEで配信しています。友だち申請はこちらから!
▶過去のカタパルトライブ中継のアーカイブも見られます! ICCのYouTubeチャンネルはこちらから!
編集チーム:小林 雅/小林 弘美/浅郷 浩子/戸田 秀成