▶新着記事を公式LINEでお知らせしています。友だち申請はこちらから!
▶ICCの動画コンテンツも充実! YouTubeチャンネルの登録はこちらから!
ICC KYOTO 2022のセッション「AIの最新ソリューションや技術トレンドを徹底解説(シーズン3)」、全11回の⑦は、清水 亮さんが次のAIのトレンドをズバリ予測します。Memeplexで画像生成をするサービスを展開中の清水さんは、大企業に個人が相克するチャンスが、テクノロジーの進化のなかでありえると言います。その理由とは? ぜひご覧ください!
ICCサミットは「ともに学び、ともに産業を創る。」ための場です。そして参加者同士が朝から晩まで真剣に議論し、学び合うエクストリーム・カンファレンスです。 次回ICCサミット FUKUOKA 2023は、2023年2月13日〜2月16日 福岡市での開催を予定しております。参加登録は公式ページをご覧ください。
本セッションは、ICCサミット KYOTO 2022 プレミアム・スポンサーのリブ・コンサルティングにサポート頂きました。
▼
【登壇者情報】
2022年9月5〜8日開催
ICC KYOTO 2022
Session 11G
AIの最新ソリューションや技術トレンドを徹底解説(シーズン3)
Supported by リブ・コンサルティング
▶「AIの最新ソリューションや技術トレンドを徹底解説(シーズン3)」の配信済み記事一覧
無料・無制限で使えるAI作画サービスを運営
清水 9月5日に、AbemaTVに出演したので、何かの足しにと思って動画を持ってきました。
▶文字打つだけ?世界が注目“神絵”描くAI パックン「芸術領域に入ると止めてはエゴ」2022年9月5日放送(AbemaTV)
先ほどもオープンソースでという話(Stable Diffusion、Part.7参照)があったじゃないですか。
僕も結構感動して、僕も何かやろうと思って、プロントが難しいので使い方をnoteに書いて販売したりしました(笑)。
▶無料作画AIサービスMemeplexの使い方(note)
こういうサービス(Memeplex)を運営しています。
尾原 砂金さんはお絵描きをさらっとやられていましたけど(Part.7参照)、テキストでどう入れるのかがものすごく今のところ難しかったわけですよね。
清水 そうですね。実際、Stable Diffusion自体は無料なんですが、動かすには結構大きいGPUが必要だったり、ちょっとスキルが必要だったりして面倒くさいし、あとは英語だから分からないという話なので、自動翻訳を付けました。
また、Stable Diffusionだけではなく、いろんなものを組み合わせて、新しい絵が作れるサービスを作りました。
できるだけ無料でやろうと思って、無料で無制限というかなり無謀な挑戦を今しています。
Stable Diffusionは無料ですよと、彼ら(Stability.Ai)があれだけ男気を見せているのに、なぜか世界中の人が結局4回目ぐらいからお金を取るみたいな。あと僕は最近会社を辞めて、サラリーマンを辞めて1人になったので、2000年代の最初ぐらいの、ビジネスモデルは考えないというやり方のウェブサービスを久しぶりにやりたくなりました。
なんか面白いからやってたわけじゃないですか、昔って。
尾原 そうですね。
清水 実はただ面白いというだけではないんです。
僕はHyperCLOVAにすごく期待しているけれども、(砂金さんを見て)今カンパニーだから、今の僕のようにめちゃくちゃなことを言えないわけですよね。
とりあえずやってから考えようぜみたいなことができません。
無料で提供すると、朝からいろいろな方々が変な言葉をどんどん入力するので、それを毎回僕はチェックして、この言葉はNGにしようと、どんどんNGワードを増やすという、iモード時代から連綿と続く簡単なお仕事に従事しているわけです。
とにかく、よくみんなこんな言葉を思いつくよなって、本当に日々勉強ですよね(笑)。
尾原 人間の欲望の部分としての行動データだけではなくて、インタラクティブにすると余計に出てくるという話にもなりますからね。
清水 そうそう。
検索から生成への移行
清水 僕は今日、そんなにたくさんメッセージはないのですが、実際に、今何が起きているかというと、検索から生成になるんだということです。
尾原 すごく良いキーワードじゃないですか、強い!
清水 だから、検索って何だったんだっけ?みたいに、検索は非常に強力なパラダイムで、20世紀末から21世紀初頭にかけて非常に流行ったワードなわけですよね。
尾原 かつ検索をできる場所が、結局ものすごい権力を持っていたわけですよね。
清水 そうです、そうです。
でも最初の最初、インターネットの最初の最初には検索はなくて、NTTの社員が作った1ページで……。
尾原 ディレクトリと呼ばれる階層をクリック、クリックして、いわゆる電話帳のように探す。
清水 階層もなくて、検索といったら、そのページを検索することだったんです(笑)。
「NASA」と検索すると、NASAのURLが出てくるみたいな、それが、なんかヤッホーというのが現れたと大学1年生の時に聞いて、「何それ?」と言ったら、「いや、なんかいっぱいあって便利なんだよ」というところで始まって。
尾原 ディレクトリが出た。
清水 そう、それでネットサーファーと呼ばれる、今考えたら朝から晩までWebサイトが本当に存在するか人間がチェックするというひどい仕事があって、それをやっていたんだけれども、ただその後はGoogleになるわけですが、検索というのは世にある情報をただ探してくるだけなんですね。
これがすごいイノベーションだった気がするのですが、「検索」は図書館情報学の用語なので、図書館に昔からあるんですね。
ただ、図書館を活用できる人というのは一部のエリートで、普通の人は図書館にあれだけ本があっても、その本の内容を使えないわけです。
だから結局は検索は始まりにすぎなくて、HyperCLOVAの話(Part.8参照)じゃないけれど、それを読み込んだ上で、何かしらの知能が検索したものを解釈しなければいけません。
解釈してから、何かしらのアウトカムを生成します。
Stable Diffusionが色々な意味で注目されていて面白い点は、いくつかあると思うのですが、例えば僕たちはなんで画像検索をしていたんだっけ?といった時に、ずばりiPhone 14が見たいという場合ももちろんあります。
でも、それ以上に何かしらの挿絵が欲しいとか、ヤカンの絵が欲しいとか、歩いている人の絵が欲しいといったときに、何か良さそうな絵があるなと思って見ると、「Getty Images」とクレジットが入っていたりします。
今のStable Diffusionも他のものも、全部素材集から取ってきている。
見るとうっすらウォーターマークが入っていて、すごいのが、Stable Diffusionのコミュニティで、ウォーターマークを消す方法とかというチャンネルがあって、ウォーターマークを消すためのAIを作っているんです(笑)。
実は今、よく言われることですが、MidjourneyもStable Diffusionも、腕を組んでいるとか、指を立てているとか、人間が取る自然なポーズがちゃんとできません。
なぜなら、ポーズに関するタグが付いていない写真が多いからです。
なぜかというと、タグにそんなことが入っていないのです。
人間のポーズというのは当たり前すぎて、タグをつけるほどのものではないのです。
ただのビジネスウーマンとか、デキるサラリーマンとか、そういうふうに書いてあるだけで、だから全く役に立たないタグしかついていないのが、50億枚あるのです。
AIと人で、存在しないものを作り出す
尾原 ちょっとショートカットすると、検索というのは今あるページや画像の中でやるから、結局ユーザーはそれ以上のものを欲しい時に我慢しているわけですよ。
清水 そうそう。
尾原 だけど、生成系になると、我慢しなくても本当に欲しいものが生成の中で見つかるかもしれない。
清水 得られる可能性が出てくると。
砂金 MidjourneyがDiscord 上でうまく実装されて、すごいなと思ったのは、あなたが探しているものに近いのは、多分このぐらいですよねと、4つパターンを出すじゃないですか。
あれはいいUXだと思うんですよね。
(一同同意)
きっとあなたが探しているものはこれですよねというのを、レコメンデーションでも検索でもなく生成で作るというのは、多分本当に次のパラダイムとしてきそうだし、Googleがまた勝ってしまうかもしれないですが、全然チャレンジできるスペースです。
尾原 だから、今あるものから選ぶのではなく、今ないものを生成して自分の理想に近づけていくということを、AIと人がゲームのようにやっていけます。
清水 まあそうですね、あと僕はここに実は勝機があると思っています。
なぜかというと、Googleが出てきた時は、Googleは別に世界で唯一のロボット型検索エンジンではなかったわけです。
当時、AltaVistaなどがあったわけで、Googleが勝ったのは単なるシンプルなアイデアで、出てくる順番が単なる日付順とかではだめだということに気づいたことなんですよね。
結局それはただのワンアイディアで、ページランクがあって、まずスピードがある。
今どこぞの学生なりがそこに気づいて、何かしらのUXなりパッケージングなりを改良するだけで、次のGoogleになる可能性は全然あります。
僕はGoogleがそこでもう1回勝つのは、意外と難しいんじゃないかなと思うんですよ。
Googleに入社したいような人って、破壊的な発想は残念ながらあまり持っていないですよね。
僕が本当に会社を辞めて良かったなと思ったのが、これ(Memeplex.app)ができないんですよね。
なにか予期しないまずい絵が出てきたらどうする?とか、実際に出てきてしまうし。
砂金 “何かあったらどうするんだ呪縛”から逃れられないですよね。
リスクあるものに対しては小さい者のほうが有利
清水 そうそう。例えば「この系列会社が、こんな酷いものを出した!」とか来たら、数兆円のブランド全体が傷つくから絶対できないとなりますが、僕は自分1人だからやっちゃおうみたいな感じでできます。
要は大きいほうがいい場合もあるけれど、今は小さいほうが有利だと思うんですよ。
尾原 確かに。だから生成になると、どうしてもリスクがあるものや色々なものが出てくるから、小さき者のほうが冒険できます。
清水 センシティブデータの話もまさにそうですが、要はなぜOpenAIもGoogleも持っているのに出さなかったかと言ったら、Googleが作ったAIでやばいポルノが出てきたらもうアウトですよ。
尾原 確かに。会社自体の問題になってしまいますよね。
清水 会社もやばいけど、そもそもAIを使ったサムシングが全部アウトになってしまいます。
それが個人とか学生とか、無責任な、怒られたら謝るという基本原則を徹底できる人のほうがやっぱり強いんです。
僕はMemeplexを無料にしたのは我ながら正解だったなと思っていて、無料にしたことで色々なものが無料になったんです。
GPU代もさくらインターネットが全部出してくれるし、電気代も出してくれるし、クラウドだけ唯一お小遣いで…、後でチラシをお渡しするので、もし暇だったら買って欲しいですけれど、これを買えば、皆さん、好きな絵を描けるようになりますので…、まあいいんですけど(笑)。
▶無料の「画像生成AIサービス」を国内最速で作ったら、クラウド料金が1日10万円になりかけた話【Stable Diffusion】(Business Insider)
何が面白いかというと、僕はMemeplexを日本語で入力すると、自動的に英語に翻訳してくれるようにしたからクラウド代がかかっているのですが、昨日マイクロソフトさんが来て、1,000万円分のクラウド代を無料にするから、うちで翻訳をやってくださいよというふうな話がありました。
要はお金を取らないというノーガード戦法にすることによって、色々な人が協力しやすくなります。
これで僕が儲けて私腹を肥やすとなると、急にしょぼい話になってしまいますが。
だから、何もない人が強くなるというのは、すごくインターネット黎明期みたいなんです。
尾原 確かに、非常に似ていますね。新しいものが生まれるから、一緒に作っていこうよと。
清水 そうそう。僕はUber Eatsと技研Barの利益だけで暮らせるので、あとクラウド代だけUber Eats100回分ぐらいで払うかと(笑)。
(一同笑)
▶さすらいのUberEats配達員(note)
尾原 検索から生成に変えることでアップデートできるビジネスエリアは非常にたくさんあるし、それが色々な方が協力し合って、その生成というもののモデルを一緒に学習したくなるようなループを作ればいいから、確かにこれはICCのテーマですね。
清水 そうなんですよ。
(続)
【本セッション記事一覧】
- AIの開発に関わるトップランナーたちが集結したシーズン3!
- 「人流データ」から、何がどこまでわかるのか?
- Googleマップの薄い青い円はデータの誤差! 高精度のAIに必要なものとは
- 取得データが多すぎる問題にどう対処する? unerryが上場した目的
- 全国254万箇所の来店検知で「行動DNA」が丸わかり
- 動的データで、人のペルソナ分類から半導体出荷量予測まで明らかに
- イメージと手描きでリアルな画像生成、話題の画像生成AI「Stable Diffusion」
- 長文要約、文章生成…ここまでできる! 日本語の大規模言語モデル「HyperCLOVA」
- 日本のビジネスメールや心削られる謝罪メール、すべてAIにおまかせ
- 天才プログラマー清水 亮が指摘する「検索から生成へ」の変化
- ハイコンテクストな文化こそが参入障壁、日本の「生成系」に勝機あり!
▶新着記事を公式LINEでお知らせしています。友だち申請はこちらから!
▶ICCの動画コンテンツも充実! YouTubeチャンネルの登録はこちらから!
編集チーム:小林 雅/小林 弘美/浅郷 浩子/戸田 秀成