▶カタパルトの結果速報、ICCサミットの最新情報は公式Xをぜひご覧ください!
▶新着記事を公式LINEでお知らせしています。友だち申請はこちらから!
▶ICCの動画コンテンツも充実! YouTubeチャンネルの登録はこちらから!
ICC KYOTO 2024 スタートアップ・カタパルトに登壇した、APTO 高品 良さんのプレゼンテーション動画【AI開発でポイ活! 幅広いアプリユーザーが高速かつ高品質なアノテーションデータを作成する 「harBest」】の文字起こし版をお届けします。ぜひご覧ください!
ICCサミットは「ともに学び、ともに産業を創る。」ための場です。そして参加者同士が朝から晩まで真剣に学び合い、交流します。次回ICCサミット FUKUOKA 2025は、2025年2月17日〜 2月20日 福岡市での開催を予定しております。参加登録は公式ページをご覧ください。
本セッションのオフィシャルサポーターは EVeM です。
▶【速報】廃プラと活用企業をつなぐ循環型サプライチェーンで、ごみを資源に生まれ変わらせる「レコテック」がスタートアップ・カタパルト優勝!(ICC KYOTO 2024)
▼
【登壇者情報】
2024年9月2〜5日開催
ICC KYOTO 2024
Session 1A
STARTUP CATAPULT スタートアップの登竜門
Sponsored by EVeM
高品 良
APTO
代表取締役CEO
サービス公式HP | 公式X
大学で経営工学分野の専攻をした後、SEとして大手基幹系システムのインフラ構築やバックエンドの開発に携わる。2017年にVR事業で独立し、エンタメ系VRコンテンツの開発を手掛ける。2020年1月にAIのデータ作成に課題を感じ、APTOを共同創業。
▲
高品 良さん APTO(アプト)の高品と申します。
よろしくお願いします。
弊社は、一言で表すと、「AI Data Company」です。
その理由について、ご紹介させていただきます。
AIにとって重要な3要素とは
AIには基本的に、3つの要素があります。
「データ」「アルゴリズム」「計算リソース」です。
最後の2つに関しては、皆さんご存知のビッグプレイヤーがいると思いますが、データについては、どの会社がプレイヤーかお分かりになりますでしょうか?
そうなんです、まだ、誰もが知るプレイヤーはいないのです。
ここを、APTOが狙いたいと思っています。
AI開発で最も時間がかかるのはデータ準備
現在のAI開発の課題についてですが、2023年のAI白書の報告書には、学習データを保有・蓄積していなかったと回答をした企業は全体の43.5%、学習データの整備が困難だったという回答をした企業は47.8%で、これらの課題によりAI開発が頓挫したケースが非常に多く発生しています。
AI開発はどのように行われているのでしょうか。
AI開発には主に4つのプロセスがあり、「データの収集・作成」「AIの構築」「システムへの組み込み」「評価」です。
評価をもとに再度、データの収集・作成を行います。
この中で最も時間がかかるのは「データの収集・作成」で、全体にかかる時間の80%近くを占めてしまっています。
アノテーション作業の例
そもそも、「データ作成」とは何でしょうか。
「アノテーション(=データ作成)」とは、簡単に言うと、正解ラベルを付与することです。
こちらは警備業界における事例で、防犯カメラから白杖を検知したい場合のアノテーションの例です。
このように、白杖を多角形で囲む必要があります。
これは倍速でお見せしているので早く見えますが、非常に労力のかかる作業です。
課題はデータを整理しきれない、人手やデータがないこと
AI開発のデータ課題は、 次の3つのどれかに当てはまります。
自社にデータがあるけどとても整理しきれない、作業をしたいけど人員が足りない、そもそも肝心のデータがない、です。
私自身、会社を創業する前にAI開発をした際、データがないという課題を抱えました。
これらを解決するために、「harBest(ハーベスト)」というサービスを開発しました。
全国のクラウドワーカーがアノテーションデータを作成
それでは、デモンストレーションをご覧ください。
まず企業は 様々な機械学習のタスクタイプから、対象のタスクを選択します。
プロジェクト名、公開範囲、予算を入力します。
作業者の属性、実施期限、作業の説明を入力します。
今回は、画像に関するタスクなので、画像ファイルをアップロードします。
最後に開始ボタンを押すと、弊社が抱える、全国にいるワーカーにタスクが飛び、ワーカーはトマトを四角形で囲むだけでポイントがもらえます。
四角形で囲む案件だけではなく、他のアノテーション作業も実施できます。
画像だけではなく、音声、自然言語、LLM(大規模言語モデル)など、様々なタスクが実施できます。
クラウドソーシングを行う場合、1枚のタスクに対して必ず奇数人に実施してもらうことで、どのデータが最も品質が高いのかが分かる仕組みが入っています。
企業によっては、秘匿性が高いデータを取り扱うケースも多くあるため、セキュリティレベルに応じてユーザーをカテゴリー分けしています。
NDAを締結しているProユーザーもいます。
Proユーザーでも難しい場合、弊社が完全内製化でアノテーション作業を実施するケースもあります。
品質が担保されたら重要なのは金額とスピード
これはあるプロジェクトの例で、秘匿性の高いデータを多角形で囲むアノテーションでしたが、ご覧の通り、harBestのみが、2週間で安価に実施しております。
お客様にとっては、品質が担保されていれば、あとは金額とスピードが、データ収集とアノテーションに求められる重要指標です。
そのため、harBestが選ばれます。
世の中には、クラウドソーシングサービスがたくさんあるじゃないかとよく言われるのですが、弊社は独自のアノテーションシステム、そして独自のコミュニティを持っていることが強みとなっています。
APTOの3つのビジネスモデル
弊社は3つの主要なビジネスを行っています。
1つ目はご紹介させていただいたウェブ発注プラットフォーム、そしてアノテーションツールを備えた「AIデータ SaaS」です。
2つ目はアノテーションからAI開発まで一気通貫でできる「AIソリューション」。
そして3つ目は、「AIデータセット販売」プラットフォームです。
スマホでタスク完了、貯めたポイントはAmazonギフト券に
harBestの競争優位性について、スマホアプリの観点からご紹介します。
harBestは、基本的に、大企業のAI開発をスマホアプリで支援することでポイントがゲットできます。
データ作業もバラエティ豊富で、自分の身近なものを撮影したり、簡単なアノテーション作業をしたりして、ポイントがもらえます。
貯まったポイントは、即時Amazonギフト券に交換することができます。
harBestユーザーのインタビューです。
こちらの方は、harBest歴2年と長くご利用いただいており、月間で8万円ほど稼いだこともあるユーザーです。
この方は30代の元ラガーマンで、現在は誰もが知っている大手小売業界で働いております。
貯めたポイントで、家電製品を購入しているようです。
harBestを利用している最も大きな理由は、ポイ活アプリの中で最も稼げるからです。
専門性が高い作業に対応できるコミュニティ
harBestでは、専門性が高い作業も依頼することができます。
現在のAI開発用データについては、誰でもできる作業よりも、専門性が高い作業の依頼が増えてきています。
例えば、医師や農家のような方への依頼です。
harBestでは現在、このようなエキスパートユーザーのコミュニティも作っており、より幅広く相談いただけるようになってきています。
harBestはユーザーに収集してもらったデータや、社内で収集したデータを販売しております。
権利問題が話題になりがちですが、弊社のプラットフォームには権利問題をクリアしたデータがあふれています。
報酬はポイ活とギグワーカーの間
ポイ活アプリとしてのharBestの立ち位置についてですが、他社サービスでは月間平均2,000円が中心のところ、harBestではそれらをはるかに上回るポイント貯めることができます。
harBestは、他社ポイ活アプリとUber Eatsなどのギグワーカーの中間領域をターゲットとしています。
現在、利用実績は100社を超えており、 様々な企業のAI開発を支援させていただいております。
AIのデータ市場と自社売上が拡大中
2010年代後半からAI幻滅期だと言われてきましたが、今はいかがでしょうか。
スタートアップ界隈のみならず、各企業でも生成AIが話題ではないでしょうか。
そういう時代背景もあり、弊社も500%成長と、売上を伸ばすことができています。
マーケットのCAGR(年平均成長率)も27%以上で、非常に盛り上がっている領域だと言えます。
ICC登壇企業、理化学研究所など100を超える支援先
過去にICCサミットに登壇された企業の支援も、多くさせていただいており、AGRISTもそのうちの一社です。
▶ピーマンに特化した自動収穫ロボットで、持続可能な農業を目指す「AGRIST」(ICC FUKUOKA 2023)
ロボット収穫機を通じて、今後日本が解決しなければならない社会課題について支援させていただいていることを、非常に嬉しく思います。
また、理化学研究所など、日本で最先端の研究をしている研究所や企業も支援させていただいており、AIデータに関して、多くの企業と接点を持たせていただいております。
日本国民総動員で日本をAI先進国に
まとめますと、AI開発の多くのケースで、データ課題が発生します。
それを解決するために、3つのサービスを提供させていただいています。
アノテーションアプリharBestは、日本では弊社のみが提供しています。
生成AIが盛況で、マーケットが非常に拡大しています。
「Software is eating the world」から、「AI is eating software」へ。
▶ソフトウエアに代わりAIが「世界を飲み込む日」は近い 長谷佳明(エコノミストonline)
しかし、 高精度なAIを開発するためには、高品質なデータが不可欠です。
日本国民総動員で、日本をAI先進国にしていきませんか?
ありがとうございました。
(終)
▶カタパルトの結果速報、ICCサミットの最新情報は公式Xをぜひご覧ください!
▶新着記事を公式LINEでお知らせしています。友だち申請はこちらから!
▶ICCの動画コンテンツも充実! YouTubeチャンネルの登録はこちらから!
編集チーム:小林 雅/小林 弘美/浅郷 浩子/正能 由佳/戸田 秀成