【NEW】ICC サミット FUKUOKA 2025 開催情報詳しくはこちら

7.「実現できたらノーベル賞級」すでに膨大なデータを持つ楽天が“データ生成”のAIを研究する理由

平日 毎朝7時に公式LINE@で新着記事を配信しています。友達申請はこちらから!
ICCの動画コンテンツも充実! Youtubeチャネルの登録はこちらから!

「AIやデータの活用が企業経営を変える(シーズン2)」9回シリーズ(その7)では、楽天の常務執行役員にしてCDO (チーフデータオフィサー)を務める北川拓也さんが、世界が注目する「データ生成AI」について解説します。膨大な購買データを有する楽天はなぜ、さらなるデータ生成を目指す必要があるのでしょうか? ぜひご覧ください!

▶ICCパートナーズではコンテンツ編集チームメンバー(インターン)の募集をしております。もし興味がございましたら採用ページをご覧ください。

ICCサミットは「ともに学び、ともに産業を創る。」ための場です。毎回200名以上が登壇し、総勢800名以上が参加する。そして参加者同士が朝から晩まで真剣に議論し、学び合うためのエクストリーム・カンファレンスです。次回 ICCサミット FUKUOKA 2020は、2020年2月17日〜20日 福岡市での開催を予定しております。参加登録は公式ページのアップデートをお待ちください。

本セッションは、ICCサミット KYOTO 2018 プレミアム・スポンサーの日本アイ・ビー・エム様にサポート頂きました。


【登壇者情報】
2018年9月4〜6日開催
ICCサミット KYOTO 2018
Session 4D
AIやデータの活用が企業経営を変える(シーズン2)
Sponsored by 日本アイ・ビー・エム

(スピーカー)
荒川 朋美
日本アイ・ビー・エム株式会社
取締役 執行役員 カスタマーサクセス事業担当

北川 拓也
楽天株式会社
執行役員 CDO グローバルデータ統括部ディレクター

佐藤 光紀
株式会社セプテーニ・ホールディングス
代表取締役 グループ社長執行役員

鈴木 健
スマートニュース株式会社
代表取締役会長兼社長 CEO

(モデレーター)

山内 宏隆
株式会社HAiK
代表取締役社長

『AIやデータの活用が企業経営を変える(シーズン2)』の配信済み記事一覧


連載を最初から読みたい方はこちら

最初の記事
1.「身体を持たずして『知能』は生まれえない」“ルンバの父” R.ブルックス博士が語る人工知能論とは

1つ前の記事
6. 資本も10倍、社員も10倍、データも10倍。AI分野における中国の圧倒的競争力に日本が立ち向かうためには?

本編

山内 もう1つ投げかけなのですが、良い独裁者の反対の概念、いわゆるDAO(Decentralized Autonomous Organization:自律分散型組織)のような、中央がいない、当然独裁者もおらず分散しているのだけど、それぞれが勝手に自律して何だかきちんと回っている、という世界はどう思いますか?

もう1つあります。またシミュレーションの話になって恐縮なのですが、結局「数は力」だよね、マザーマーケットの規模だよねとなると、日本人であることに若干悲しみを感じます。

では何かデータで勝負できないだろうか? と思うのです。

絶対勝てないのかというと、僕はやりようがあると思っていて、それは「データを生成する」ことです。

強化学習のような話です。あとはGAN(※)とか、ああいう世界の話ですね。

▶編集注:GAN(Generative Adversarial Networks:敵対的生成ネットワーク)とは、2つのディープラーニングのモデルを競わせて、お互いの精度を高める生成系のAI技術。膨大なデータの収集・分析の省力化やクリエイティブAIへの応用などが期待されている。

リアルデータはどうやっても(中国の)10分の1しか取れないですが、シミュレーションをしまくって、間のデータを埋めることによって日本企業は何か活路を見出せないだろうか、みたいなことを昔考えていたんですけど、それは的外れでしょうか

北川さん、どうですか?

膨大なデータを有する楽天が試みる「データ生成」とは

楽天株式会社 執行役員 CDO グローバルデータ統括部ディレクター 北川 拓也さん

北川 皆さんに説明すると、いわゆるGANというのは、「画像」を生成する技術として知られています。

その延長線上でたとえば、僕たちはEコマースですけれども、Eコマースの顧客の購買データだとか、顧客のウェブサイトをブラウジングしている時の「データ」を生成する論文というのも最近出始めています。

実際、僕たちのメンバーも同じことを言っていて、データ生成モデルをとりあえず作ろうということで、実はやっているんですね。

僕たちは溢れるほどのデータを持っていて、それさえ使いきれていない中で、さらに生成してどうすんねん、みたいな問題はありつつも、データを生成しようとしています。

なぜデータの生成が大事かというと、アルファ碁がなぜ最適な指し手を解くことができるのかというところにその答えがあります。

アルファ碁の対局は「パーフェクトゲーム」と言われていて、打ち得る手を全て試して最適な指し手を選択します。

これをロールアウトと言うのですが、ルールが決まっているので、この手がいいはずだと判断して打った後の、その後のゲーム展開を自動的にプレイできます。

自動プレイをした結果、勝つか負けるかを見極めることができるから、その一手の良さが判断できます。

他方、人間の行動の難しさは、生成モデルがないことにあります。

たとえば、ある人がこの広告をクリックしたという事実から、その後に最終的に購買するか否かというロールアウトはできません。

だから、購買データが得られても生成モデルはありません。

これが実は問題点だと言われていています。

これをロールアウトすることができないか、アルファ碁と同じぐらい強力なAIをショッピングだとか広告の購買の分野で作ることができないか、ということを僕たちは考えていて、それを実現させようとしています。

ここに、先ほどの生成モデルの話が乗っかるのですが、もし実現できたら正直ノーベル賞級のイノベーションです。

想像できないほど、儲かりますよ。

山内 1、2年では無理だと思うのですが、5年ぐらいの単位で北川さん級の人が本気で取り組んだら……。

北川 頑張ります (笑)。

気象データとAIで、天気予報の正確さが30%向上

日本アイ・ビー・エム株式会社 取締役 執行役員 カスタマーサクセス事業担当 荒川 朋美さん

荒川 データ生成には至らないんですけど、データというのは、AIを考える上で非常に重要な要素ですよね。

山内 はい、もうそれだけといっても過言ではないと思っています。

荒川 今回ICCサミットのスポンサーにもなっていますが、ウェザーカンパニー (The Weather Company) という気象会社をIBMが買収しました。

意外に知られていませんが、皆さんのスマホに標準でついている天気のアプリは、TWCのデータを使っていただいていたりします。

気象データというのは、恐らく世の中に存在しているデータの中で、分析できる最も大きなデータなのではないかと思うのです。

約6,000台のサーバーの上で動いています。

気象の情報をどのように取っているかというと、昔はアメリカの気象庁から大体年間40万円で買っていました。

ウェザーチャンネルというCNNのお天気の会社はそこから始まっています。

そして今や、データで勝っていくために独自にデータを取る方法を探し始めたわけなんですよね。

今ではたとえば飛行機のセンサーからも気象データを集めています。

1日で5万に上るフライトからリアルにセンサーデータを収集していて、気象をかなり正確に予測できるところまできています。

あとはThe Wether Companyのお天気アプリも提供して、許諾をいただいた方からは、スマホのセンサーデータを集めさせていただいき、精度向上に役立てています。

なので、一見プッシュ型で情報を提供しているように見えますが、情報を集めています。

アプリがインストールされ、許諾いただけた方の数だけ温度や気圧などのデータが得られるわけです。

そういったデータをどれだけ集められるかが、やはりこれからの情報社会で勝っていくためのポイントになると思います。

先ほどお話しした飛行機、1日5万フライトの中から入ってくる情報もそうですし、それからヨーロッパでは、車の中に実装してワイパーが動いているかどうか見ています。

ワイパーがどれくらいのスピードで動いているかによって雨量が分かります。

そういったデータをどう取るかによって、特に今まで使っていなかったデータをいかに供給してくるかによってビジネスの勝負がついてくるのではないかなと思うのです。

だからこそIBMは、そういう膨大なデータを持つ会社を買収して、データのAI化などにも今は取り組んでいます。

山内 まだまだいろいろでてきそうですね。

荒川 ワトソンを載せて、天気予報の確率が30%上がりました。

気象データとAIを使うことで、流体力学のアルゴリズムから予想していった天気予報よりも、30%改善されました。

山内 すごいですね。

荒川 そうですね。今後はいかにその精度を上げていくかです。

今のコンピューターの限界ゆえに、2週間先までしか予測できないんですよね。

山内 量子コンピューターも関係してきますか?

【一挙公開】量子コンピューティングで実現する社会(ICC FUKUOKA 2018)

荒川 おっしゃる通りなんです。よくぞ振っていただきました。

2週間の予測というのは、ノイマン式のコンピューターの限界です。

2週間を超えると予報の精度が下がるんです。つまり確率が下がる。

山内 限界なんですね。

荒川 はい。パターンが多すぎて、2週間以上先の気象は予測できないのです。

もし量子コンピューターを使って3ヵ月先、6ヵ月先、9ヵ月先、1年先の気象を予報できるとしたら、ビジネスモデルにどんな変革が起きるか。

誰が勝者になってどんなビジネスオポチュニティが生まれるか、そういうことを考えるのがやはりこれからのデータとAIの世界かなというふうに思っています。

山内 そうですね、何か相当変わりそうですね。

(続)

次の記事を読みたい方はこちら

続きは 8.「データの中の“化け物”が見えるかどうか」AI時代のサイエンティストに求められる能力とは をご覧ください。

平日 毎朝7時に公式LINE@で新着記事を配信しています。友達申請はこちらから!
ICCの動画コンテンツも充実! ICCのYoutubeチャネルの登録はこちらから!

編集チーム:小林 雅/浅郷 浩子/尾形 佳靖/戸田 秀成/鈴木ファストアーベント 理恵

他にも多く記事がございますので、TOPページからぜひご覧ください。

更新情報はFacebookページのフォローをお願い致します。

この記事が気に入ったら
いいね または フォローしてね!