【NEW】ICC サミット KYOTO 2024 開催情報詳しくはこちら

3. コンペ形式でアルゴリズムを集めるメリット

ICC FUKUOKA 2024のセッション「AIの最新ソリューションや技術トレンドを徹底解説(シーズン6)」、全13回の③は、リングサイドのDROBE 都筑 友昭さんから始まって上地 練さんへの質問が続きます。「Solafune」で集めたアルゴリズムの開発方法と開発リソースは?オープンデータとクローズドデータの判断は?上地さんがもし衛星データをターゲットとしていなかったら?!ぜひご覧ください!

ICCサミットは「ともに学び、ともに産業を創る。」ための場です。そして参加者同士が朝から晩まで真剣に学び合い、交流します。次回ICCサミット KYOTO 2024は、2024年9月2日〜 9月5日 京都市での開催を予定しております。参加登録は公式ページをご覧ください。

本セッションのオフィシャルサポーターは Notion です。


【登壇者情報】
2024年2月19〜22日開催
ICC FUKUOKA 2024
Session 11C 
AIの最新ソリューションや技術トレンドを徹底解説(シーズン6)
Supported by Notion

(スピーカー) 
砂金 信一郎
LINEヤフー       
生成AI統括本部 新規事業準備室 室長(登壇時)
現職:Gen-AX株式会社
代表取締役社長 CEO

上地 練
Solafune
代表取締役CEO

西脇 資哲
日本マイクロソフト
コーポレート戦略統括本部 業務執行役員 エバンジェリスト

武藤 悠輔
ALGO ARTIS
取締役 VPoE

(リングサイド) 
柴戸 純也
株式会社リンクアンドモチベーション
執行役員

土田 安紘
AWL
取締役CTO

都筑 友昭
DROBE
執行役員VP of Advanced Tech Delivery

山崎 はずむ
株式会社Poetics
代表取締役

(モデレーター) 
尾原 和啓
IT批評家

「AIの最新ソリューションや技術トレンドを徹底解説(シーズン6)」の配信済み記事一覧


未開拓地の資源探査に技術提供

上地 こちらは未開拓地で、まだ掘られていない鉱山の資源探査です。

波長などを見ながら地道にマッピングしていって、ここを掘ったら良さそうだといった議論を政府としていく活動をしています。

西脇 この左側にある黄色い所は何ですか?

上地 これは鉱山で、ここに何があるかすでに分かっています。

中国が集中的に掘っている場所もあり、どこに何があるか一定分かってきている感じです。

中国企業、コンゴで最大70億ドルのインフラ投資 鉱山合弁の一環(ロイター)

右下がザンビア経路、左下がアンゴラ経路で、どこを取るか各国争っている感じですね。

このように、政府の機密性の高いデータを扱いながら、まず鉱山向けに技術開発すると、次は農業、防衛、災害分析もやりたいというふうに、依頼を多く受けるようになってきています。

尾原 しかも衛星が増えているから、撮影周期もどんどん上がっているし、低高度になっているから、本当はもっと高解像度で撮れます。

今のお話は鉱山でしたが、災害救助に使えたり、色々な形で活用できる形になっていくのでしょうね。

上地 そうですね。

あとは、途上国には地図がそもそもないような国がたくさんあります。

昨年(2023年)コンゴに行ったのですが、Googleマップが全く機能しませんでした。

当たり前のように道路を勝手に逆走したりするので、道かどうか分からない、それでコンゴのGoogleマップを作るのをやめたんだよねみたいなことを、Googleの人が言っていました。

住所を入力しても、大きくずれるみたいなことが起こったりするので、地図をアップデートする仕組みを衛星で作るような取り組みもしています。

コンペ形式でアルゴリズムを集めるメリット

都筑 友昭さん(以下、都筑) すみません、よろしいですか?

尾原 いきましょう!

都筑 DROBEの都筑と申します。よろしくお願いいたします。


都筑 友昭
株式会社DROBE
執行役員VPoATD

半導体のエンジニアとしてキャリアをスタート。回路設計や組み込みのソフトウェア開発などを行っていたが、iPhone3GSの発売によりアプリ開発にハマりソフトウェエアエンジニアにキャリアチェンジ。 ソーシャルゲームプラットフォーム運営会社にてKPIの計測基盤やUnityによるゲームの開発などを行った後、EMとしてゲーム開発チームのマネージメントを行う。 その後フリーランスとなりWeb系の案件を複数行いながら自分の会社の運営を行い、2016年よりBCG Digital Venturesに参画。AIなどの先端的な技術を用いたPoC案件などに携わった後、2019年より株式会社DROBEにCTOとして参画。2023年より先端技術の実装を目的とした Advanced Tech Delivery 部の VP に就任。

先ほど軍事利用みたいなお話もあったと思いますが、コンペをして買い取ったアルゴリズムを、そこから自社で伸ばしていらっしゃる形になるのでしょうか?

上地 基本的には、そういう形にしようとしているぐらいの感じです。

もちろんオープンにできないものもあるので、例えば軍事利用で戦車を見つけたいという検出系のニーズがあったときに、僕らは戦車を検出する技術を開発することをうたってコンペはしません。

車を見つけるコンペをやりましょうと言ってコンペをして、それをファインチューニングしていくようなアプローチです。

都筑 では、種みたいなものをコンペで広く募って、そこである程度ベースになるようなものが作られて、そこから先をファインチューンというか、特定のアプリケーション向けに自社で伸ばす形のビジネスモデルですか?

上地 おっしゃるとおりです。

コンペでやる利点は、技術がたくさん集まるだけでなく、実はこういうオープンなソフトウェアがあるとか、この国がこういうデータをオープンにしていて、という情報を、ユーザーが引っ張ってきてくれることです。

それが使えるのかとか、そのデータはオープンだったんだとか、僕らも知らない情報がたくさん集まってくるところが、非常に良い点だと思います。

尾原 データソース自体も集合知として集まってくるし、そこからツールも作ってくれるかもしれないしという、総合的な形になっていくわけですね。

上地 はい。

尾原 AWLは、衛星という空の目に対して、店舗のカメラという地上の目みたいな感じですけれど、ヒントになることやご質問はありますか?

開発のリソースはどうする?

土田 安紘さん(以下、土田) 今のお話で、すごく勉強させてもらっています。


土田 安紘
AWL株式会社
取締役CTO

北海道勇払郡生まれ。 北海道大学大学院修士課程修了。 2001年4月に松下電器産業株式会社(現パナソニック(株))に入社し、NTTドコモ向け携帯電話のミドルウェア開発に従事の後、本社R&D部門にて幾つもの新規事業開発プロジェクトを牽引。その後、米国シリコンバレーでの社内起業プロジェクトリーダに抜擢され、2012年から2016年まで米国・日本市場向けのモバイルO2Oサービス事業の立ち上げを主導。 AI新時代の到来、AI活用ビジネスの最前線で業界リーダーとして”ふるさと北海道”からグローバル市場を切りひらくための挑戦の場として魅力を感じ、参画。全社技術戦略、知財戦略を統括。2019年9月に取締役就任。

アルゴリズムを買い取った後、運用に回すための技術作りは、これはこれで相当大変なのではないかと思います。

まず鉱山を発見するためのアルゴリズムやAIは作れる、でもそれをある一定のコストでビジネスとして回る形で運用していく部分を、御社が全部作るのは結構きついのではないかと思ったのですが、その辺りはいかがでしょうか?

上地 そうですね。

いわゆる機械学習のパイプラインや、常にファインチューニングしていかないといけない部分は結構大変ですけれど、そこは今は自社でR&Dチームを抱えて地道にやっています。

尾原 今、何人ぐらいですか?

上地 20人ぐらいです。

基本的に僕らはオペレーションを担当していて、ベーシックなモデルの開発や新規のアイディアの探索は、コンペを通して世界中から集めてカバーしている感じです。

土田 アルゴリズムやモデルごとに多少なりともオペレーションは違うと思いますが、それごとに1つずつ作っていくような感じですか?

上地 そうです。

あとは、僕らもコア、ノンコアをはっきりさせていて、ノンコアに関してはオープンソースにして、コントリビューターに付いてもらって、運用してもらうようなことはやっています。

コンペによっては、オープンソースにしますみたいにすることもあります。

尾原 MicrosoftやLINEヤフーでは、プラットフォームの観点で考えたときに、こういうコラボレーションはしていくものなんですよね?

どのぐらいデータがオープン化され、アルゴリズムとモデルが増えたかみたいなところで言うと、いかがですか?

西脇 Microsoftは公開できるデータとモデルはクラウド上で公開しています。

プラットフォームというかエコシステムができるようになっていて、モデルやデータの使い方を考えた人に利益が回るような仕組みも、一応提供はしています。

どんな人がSolafuneのコンペに参加しているのか

西脇 逆に聞きたかったのは、コンペに参加する人たちの傾向です。

誰がこのコンペに参加するのですか?

上地 現職のデータサイエンティストの割合が一番多いですが、それでも4割いかないぐらいですね、38%とか。

西脇 では残りの6割は?

上地 そのうちの3割ぐらいがアカデミアの人で、大学の研究者、学生です。

尾原 それは素晴らしい。

上地 結構学生がコンペで勝つのですが、研究室のコンピューティングリソースをめちゃくちゃぶん回している人もいます。

僕らもソースコードを回収するときに、ちゃんとモデルが動くか検収するのですが、「なんだ、この環境は?!」みたいなこともあって、これ、どうやって用意しようかなみたいな(笑)。

尾原 コンシューミング(※消費)にはね(笑)。

上地 というのは、結構あります。

あとはデータサイエンティストではなくてビジネス職だけれど、そういう解析ができますみたいな方が意外といらっしゃいますね。

あとはソフトウェアエンジニアの方で、データサイエンティストではないけれど、コンペは趣味でやっていますみたいな方もいらっしゃいます。

尾原 これは、新しいコラボレーションの形ですよね。

砂金さんは、デジタル庁の観点もおありですが。

「競争領域」と「協調領域」の判断

砂金 はい。これは競争領域と協調領域というか、みんなで作って集合知という部分と、あるところからは自社のクローズドな付加価値を差別化していかなければいけない部分がありますよね。

ケースバイケースだと思いますが、ここからはもうクローズドにしようみたいな。

OpenAIもGPTシリーズで、GPT-3まではオープンに色々な情報を出しましたが、3.5でそろそろまずいとなって、4以降は全然情報を出さないような状況になったと思います。

色々なアルゴリズムを作っていらっしゃいますが、ここからは自分たちのコアの領域だから、オープンにやる領域ではないという判断は、どのようにされていますか?

上地 学習に使えるデータを、僕らが可能な限り独占できるかどうかみたいなことで考えています。

例えば、基本的に鉱山はセンシティブなのでどこにあるか公開されませんが、僕らはコンゴの鉱山のグラウンドトゥルースデータを取れていて、他の機関では持っていません。

だったら、ここはコアにしよう、ただ、別に衛星データは僕らが独占しているわけではないので、そこは可能な限りオープンにしていいんじゃないかみたいな感じです。

砂金 どちらかというと、アルゴリズム云々というよりは、差別化できるデータがあって、これは独占できるデータだと判断したときには、事業化、クローズドを選択するということですね。

尾原 例えばパートナーシップとして、あなたの国には詳細なデータを提供しているから、その代わり、そこに関するグラウンディングをするような、向こうからの事実情報と付き合わせてくださいみたいな形で、本当に大事なところはパートナーシップ的にやっていって、一方で外に出しても問題ないところは、どんどん協調的にやっていくとか。

グラウンディング(Grounding)とは?その意味とビジネスへの影響(セールスフォース)

上地 そうですね。今はそういう感じになっています。

尾原 なるほど。だから新しいフリーミアムみたいなものですよね。

逆にデータで活用先を考えれば、うちにとって重要なので、そこだけはうちもデータを提供するのでパートナーでやらせてくださいませんかみたいなことが、どんどん生まれてくるということですよね。

上地 そうですね。そうなるといいなと思っています。

この国の衛星を使いたいけれど、アプローチしにくいなという場合には、逆に公開してもらって、相手国側でモデルを作ってもらったほうがいいものもあるので。

尾原 そのほうが早い場合もあるんですね。なるほどね。

ちなみに、衛星というパターンでやるから、会場の皆さんはすごいと感じていると思いますが、船舶情報だったり、他のパターンもあり得ると思うんですよね。

上地 当然あり得ます。

上地さんが衛星をターゲットにしていなかったら

尾原 上地さんが衛星をターゲットにしていなかったら、協調領域と競争領域はどこでやっていましたか?

非常に、会場の皆さんのヒントになると思うんですよね。

上地 どこでやっていましたかね? ……意外とゲームとか、やっていたかもしれないですよ。

ゲームのアンチチートツール(※不正行為防止ツール)みたいなのを作りたかったです。

尾原 あー、市場がありますものね。人気あるオンラインゲームほどチーターが狙うし、はびこるから。

上地 チーターをぶっ倒すぞみたいな、そういうのをやりたかったですよね(笑)。

尾原 逆に言うと、世にいるアルゴリズムを作る人たちが協力したくなって、かつデータがオープンにあるところだったら、実は市場チャンスが生まれるという話ですよね。

上地 そうですね。あとエンジニアは、ゲーマーがめちゃくちゃ多いんですよ。

それで、あの……、チーターが多いので、というのも、シンプルに自分が好きだからみたいなのもあるのですけれど。

西脇 色々なお客様と話をしていると、可能性の高いのは、要はボーダレスなものなんですよね。

衛星データは別に国境は関係ないし、言語も文化や習慣も関係ないですね。

ところがお店のとか、駐車場のとか、車両のデータとかになると、国によって全然違うので、1つのモデルでビジネスがスケールしづらいのです。

と考えると、そういうところも観点かなという気はしますね。

尾原 そうですね。この辺はまだまだ深掘りしたいところですね。

あっ、土田さん、どうぞ。

(続)

編集チーム:小林 雅/浅郷 浩子/戸田 秀成/小林 弘美

この記事が気に入ったら
いいね または フォローしてね!