【NEW】ICC サミット FUKUOKA 2024 開催情報詳しくはこちら

2. 自然言語技術が可能にしたAIアート どれだけでも描き直してくれるAI絵師登場

新着記事を公式LINEでお知らせしています。友だち申請はこちらから!
ICCの動画コンテンツも充実! YouTubeチャンネルの登録はこちらから!

ICC KYOTO 2021の最高評価セッション「AIの最新ソリューションや技術トレンドを徹底解説」、全9回シリーズの(その2)は、「絵を描くAI」について。開発のため有名アニメスタジオにしばらく通ったという清水さん。そして開発した、言葉を入力すると絵を描いてくれるAIの驚くべきクオリティとは? ぜひご覧ください!

ICCサミットは「ともに学び、ともに産業を創る。」ための場です。そして参加者同士が朝から晩まで真剣に議論し、学び合うエクストリーム・カンファレンスです。 次回ICCサミット FUKUOKA 2022は、2022年2月14日〜2月17日 福岡市での開催を予定しております。参加登録は公式ページをご覧ください。

本セッションは、ICCサミット KYOTO 2021 プラチナ・スポンサーのHelpfeel(Nota)にサポート頂きました。


【登壇者情報】
2021年9月6〜9日開催
ICCサミット KYOTO 2021
Session 12D
AIの最新ソリューションや技術トレンドを徹底解説
Supported by Helpfeel(Nota)

(スピーカー)

清水 亮
ギリア株式会社
取締役会長兼CEO

(モデレーター)

尾原 和啓
IT批評家

「AIの最新ソリューションや技術トレンドを徹底解説」の配信済み記事一覧


連載を最初から読みたい方はこちら

1つ前の記事
1.天才プログラマー清水 亮が注目する、3つの最新AIトピック

本編

尾原 最近のAIのトレンド(※) から受けて、清水 亮さんは今何を捉えて、仕事としてされようとしているのでしょうか?

▶編集注:本記事Part.1で、清水さんはAIの最近のトレンドとして「NeRF」「自然言語」「微分可能」をピックアップされました。

清水 そうですね、AIの社会実装のプロセスについてお話しします。

尾原 いよいよAIが技術的段階から社会で使われる、社会でビジネスだったり社会基盤を担うというようなところにきているわけですけれども。

清水 社会実装といっても、最初の頃は、すごくざっくりした依頼しか来ないんですよ。

例えば「具体的な意味ではないけれども、教育現場でAIを活用したいんです」というような依頼です。

(編集注:この後、ギリアが開発し、非常に高い効果を上げているAIについて具体例が語られましたが、公開範囲限定のため割愛しています)

1年ぐらい現場に行って、何が問題点なのかをまずアセスメントして、それからデータ作ってアルゴリズムを作って実装まで全部やりますね。お客様の売上と利益が上がるところまでお付き合いします。

尾原 今さらっと言っていましたが、これはめちゃめちゃ難しいことを言っているんです。

それは何かと言うと、「現状のプロセスの中のひずみを抽出する」という話と、そのひずみの中で「今のAIで一番インパクトが出せる技術的なものは何か」という話、一方でエンドユーザーも時間が限られていて「ユーザーにとって受け容れられるレベルのものは○○です」という話。

この3つぐらいのトレードオフの中で、一番インパクトが大きそうな、改善の余地があってユーザにとって受け入れられるなものを探しているということですよね。

清水 さすが尾原さん、何も説明しなくてもそのとおりです。

「絵を描くAI」開発のためアニメのスタジオに通う

清水 さて、次のトピックは、過去へタイムスリップをします。

以前から「人が描くように絵を描く機械」にすごく興味があって、しばらくアニメのスタジオに通わせていただいたことがあります。

尾原 素晴らしい。

清水 机もいただいて、スタジオに最低週一回は通っていたんです。

(編集注:この後、一流アニメーターの元で、絵を描くことについて学んだ大変興味深いエピソードが語られましたが、公開範囲限定のため割愛しています)

アニメーターの演出、描き方、動きの考え方などをずっと傍で見られる環境で、結局ただ単に邪魔しに行っているだけなんですが、差し入れとかを持って通っている中で、絵を描くということがすごく難しいんだなということは非常によく分かったんです。

この時は結局、「人間性」みたいなものが絵に反映されるから、そのまま人間のように絵を描く機械を作るのはなかなか難しいんだ、という結論になりました。

AIにテーマを与えて絵を描かせる試み

清水 そういうこともあって、絵を描くAIというものについて、2021年の春から色々やってるんですね。

例えばOpenAIのCLIPと、BigGANを組み合わせたBigSleepというアルゴリズムを使うと、「Innovator」というテーマでこういう絵が作れるところまで来ました。

これがなぜできるかというと、自然言語技術が発達したからです。

「エヴァンゲリオン」というテーマで絵を描かせると、エヴァンゲリオンらしいものができてきます。

では、見たことのないもの、例えば「死者の叡智」というテーマを与えるとこうなります。

これは結構すごくないですか?

こういうふうに言葉を与えると、AIが同じテーマでいっぱい描いてきます。

こちらは、葛飾 北斎のペンネーム「画狂老人」から取っているのですが、Gakyoという、誰でも使えるサービスをやっています。

言葉を入力すると勝手に絵がどんどん出てきます。

誰でも使えるAI絵師サービス「Gakyo」

清水 こちらは、葛飾 北斎のペンネーム「画狂老人」から取っているのですが、Gakyoという、誰でも使えるサービスをやっています。

言葉を入力すると勝手に絵がどんどん出てきます。

清水の自宅のサーバーで動いているので、うちの電気代が消費されるだけなんですが、ぜひ遊んでみてください(笑)。

すごいポンコツサービスなので、文字を誰かが上書きすると上書きされてしまう、早い者勝ちみたいな仕掛けですが、結構面白いオートマチックアトリエです。

仕組みとしては、まず潜在ベクトル「z」を乱数で与えます。

これを、「BigGAN」や「VQGAN(taming-transformer)」など、どの生成AIでもいいのですが、生成AIが絵を生成します。

生成した絵に対して、絵と言葉の相関性を見つけるCLIPというものが、最近あるんですね。

CLIPを使って、何かこの言葉とAIが出してきた絵はちょっと違うよと、絵を言葉のイメージに寄せていくみたいなことをします。

要は微分を取るのです。

その微分を取って「z」に反映させて繰り返していくと…

尾原 もう1回ループが入るんですね。

何度でも描き直してくれるAI絵師

清水 そう、これで「AI絵師」がいる生活に変わるんですね。

今まで僕はゲーム会社をやっていましたから、グラフィッカーは当然いるわけですよ。

「こんな絵を描いてよ」と言って、出てきた絵が「なんかいまいちだな」と思っても、それでしょうがなかった。

尾原 あきらめていたところですね。

清水 ところが、AI絵師の場合は、容赦なくいくらでも「描き直して」と言えます。

かわいそうなことに、AI絵師は言われたらずっと新しい絵を描き続けます。

人が持つイメージに近い絵を、美しく生成するAI

清水 一番新しいものが、VQGANで作った「artificial_intelligence_and_humanity_coexist」、「人とAIの共生」というテーマの絵です。

そう言われたら、なんかそんな感じかなと。

画像生成AIはアートのあり方を変えてしまうのか?(GigaZINE)- VQGANの解説など

尾原 そうですね。

結局、GAN(Generative Adversarial Network:敵対的生成ネットワーク)でぶん回しているうちに、なんとなく人が持っているコンセプトみたいなものだったり、そこの中に何を読み解くのかみたいな、象徴みたいなものをGANが合わせにいくレベルまで来てしまっているということでしょうね。

GANとは(データグリッド)

清水 そうなんです。

でもそれって、あくまでも表層のふんわりした雰囲気をつかむところにはディープラーニングを使っているのですが、アルゴリズム的にはちゃんと絵を完成させている。だから、いいとこどりなんですよ。

尾原 ああ、そうか、そうか。

清水 これは「人類の夜明け」です。

これは最近のもので、「SDGs」です。

「Sustainable_Development_Goals」という指定で、この絵が出てくるって結構すごくないですか?

それっぽいですよね。

尾原 すごい。

これはコンセプトとしてつかむ部分と、絵としてきれいに描く、アートとして美しく描く部分って、後者は後者で難しいじゃないですか。

清水 難しいです。

尾原 アートとして美しく描くところは、別のラーニングをやっているんですか?

清水 これはまたすごくて、「by Dalí」と書くと、(サルバドール・)ダリっぽく、「by Taro Okamoto」と書くと、岡本 太郎っぽくなるんですよ。

尾原 ダリの絵というものをベースに、またGANが生成されるので、ダリ風を勝手にAIが作ってくるんですね。

清水 そうそう。

こちらは、T-SHIRTS TRINITYというサイトで、僕がAI絵師に描かせた絵をTシャツにして売っています。

サーバの電気代を稼いでいるので、ぜひ買ってください(笑)。

AIでできる部分と作為は似て非なるもの

尾原 確かに、これはすごい便利ですよ。

清水 いいでしょう?

尾原 しかもこれをやっていると、みんながどういう発注をするのかという、また別のラーニングができますからね。

清水 そうそう。

でもこのAIで、「宮崎 駿」と入力すると、宮崎 駿さんの顔が出てきてしまうんですよ。

だから、世の中にすでにあるデータセットで学習したものだとそちら側に偏ってしまうので、今僕は自宅のパソコンで、まずは僕が過去20年間見てきた写真がすごく大量にあるので、それをAIに学習させています。

僕が見た景色だけを学習した、僕そのものみたいなAIが今できていて、2カ月ぐらい学習させています。

それをやりながら、次は「宮崎 駿っぽい」とか「アニメっぽい」というのは、こちらが教えないといけないので、それはそれで別にAIを作ろうかなと考えています。

尾原 さっきのアニメのAI化の話(Part 1参照)を聞いてパッと思い出したのが、イスラエルの自動運転のAIを開発している企業と話したときに、「つまるところ、事故防止のAIとはコミュニケーションなんだ」という言い方をしていたことです。

つまり、実は事故の7割はコミュニケーションミスで起こるんですよね。

清水 道をその人が渡ろうとしているのが分からない。

尾原 そうなんです! だから逆に言うと、コミュニケーションの問題だから、渡る前にクラクションを鳴らすというAIが正解だったりするわけですよ。

相手にコミュニケーションを伝えることが正解だから、今の話も一緒で、アニメって結局アニメーターの方に対するコミュニケーションだったり、「これは子どもに見せる映画」みたいなコミュニケーションだったり、いろいろなものが二重で意図と作為があって、そこがある種トレーニングデータというか、変わっていくわけですからね。

清水 そうそう、だからやっぱりAIだけでできる部分と作為を加える部分というのが、似て非なるものなんです。

尾原 そうなんですよね。

(続)

本内容は本セッションに登壇したした時点での発言者の個人的見解・意見を含むものであり、ギリア株式会社およびICCパートナーズ株式会社(以下「両社」)の公式見解を示すものではありません。
本掲載記事及びその内容に関し、両社はいかなる保証もするものではありません。 万一本文書の内容に誤りがあった場合でも両社は一切責任を負いかねます。

次の記事を読みたい方はこちら

続きは 3. AIを作るAI「Ghelia Spectre」 をご覧ください。

新着記事を公式LINEでお知らせしています。友だち申請はこちらから!
ICCの動画コンテンツも充実! YouTubeチャンネルの登録はこちらから!

編集チーム:小林 雅/浅郷 浩子/小林 弘美/戸田 秀成

他にも多く記事がございますので、TOPページからぜひご覧ください。

更新情報はFacebookページのフォローをお願い致します。

この記事が気に入ったら
いいね または フォローしてね!