▶新着記事を公式LINEでお知らせしています。友だち申請はこちらから!
▶ICCの動画コンテンツも充実! YouTubeチャンネルの登録はこちらから!
ICC KYOTO 2021 スタートアップ・カタパルトに登壇いただき、見事6位に入賞した、FastLabel 鈴木 健史さんのプレゼンテーション動画【「FastLabel」は高品質教師データの提供で、AI開発・実用化を推進する】の文字起こし版をお届けします。ぜひご覧ください!
ICCサミットは「ともに学び、ともに産業を創る。」ための場です。毎回200名以上が登壇し、総勢900名以上が参加する。そして参加者同士が朝から晩まで真剣に議論し、学び合うエクストリーム・カンファレンスです。 次回ICCサミット FUKUOKA 2022は、2022年2月14日〜2月17日 福岡市での開催を予定しております。参加登録は公式ページのアップデートをお待ちください。
本セッションは、ICCサミット KYOTO 2021 ダイヤモンド・スポンサーのノバセル にサポート頂きました。
▶【速報】“業界DX”で巨大市場が動く!オフィス不動産データプラットフォーム運営の「estie(エスティ)」がスタートアップ・カタパルト優勝!(ICC KYOTO 2021)
▼
【登壇者情報】
2021年9月6〜9日開催
ICC KYOTO 2021
Session 1A
STARTUP CATAPULT
スタートアップの登竜門
Supported by ノバセル
鈴木 健史
FastLabel株式会社
代表取締役社長
早稲田大学大学院創造理工研究科修了。在学中、機械学習のアルゴリズムの研究に従事し、国内外4つの学会にて研究発表、査読付き論文採択を経験。新卒で株式会社ワークスアプリケーションズに入社し、エンタプライズ向けの会計システムのフルスタックエンジニアとして企画・開発から保守運用までを経験。在職中は、新製品の会計クラウドサービスの立ち上げや会計製品へAIを実装するプロジェクトをPMとして企画から実装までリード。その後、法人向けのAIフードデリバリー企業を共同創業し、ビジネスプランから開発全般までと事業立ち上げを経験。その後、独立しFastLabelを創業。
▲
鈴木 健史さん おはようございます、FastLabelの鈴木です。
我々は、「テクノロジーを用いてAIの教師データ作成を自動化」していきます。
AI開発では8割の時間が「教師データ作成」に費やされる
皆さん、AIの開発がどのように行われているか、ご存知でしょうか?
AI開発では、主にディープラーニングなどに代表される「アルゴリズムの開発」と、AIに教えるための「教師データの作成」に時間が費やされるのですが、なんと約80%の時間が教師データ作成に費やされているのです。
そしてこの作業には人手が多くかかるので、AI開発の予算の3分の1が、この教師データ作成に投じられています。
グローバルでのAI市場は今後7年で、約10倍以上に急拡大予定です。それに伴って教師データ市場も急拡大し、約8兆円の巨大市場になっていきます。
そんな急拡大市場で今、大きな変化が起きています。
AIの精度向上のカギは「教師データの質」
それは、「アルゴリズムのコモディティ化」です。
ディープラーニングなどのアルゴリズムは、既に企業がゼロから開発するものではなくなり、GitHubなどのインターネット上に公開されているものから選択して利用する時代になってきています。
また、アルゴリズムを改善することでのAIの精度向上は、非常に困難です。
実際、海外のディープラーニング分野の著名な教授によるプロジェクトで、アルゴリズムを改善したチームは3カ月かけても全く成果がなかったのに対し、教師データの質のみを改善したチームは3カ月で約17%の精度改善に成功しています。
▶人工知能の権威アンドリュー・エンが語る「データの質」の重要性(Forbes JAPAN )
教師データの質には、まだまだ改善の余地があるのです。
教師データ作成の課題①労働集約的な作成方法
しかしこの教師データ作成は、実はいまだに労働集約的に行われているのです。
つまり、労働集約を解放するためのAI開発の裏側で、データ作成は労働集約的に行われていたということです。
では、どのようにデータ作成が行われるのか、こちらのししとうを自動で収穫するためのAIのデータ作成の様子をご覧ください。
このように、「これはししとうです」と示すためのデータを、一つ一つ丁寧に写真上で囲っていくことで作るのです。
信じがたい光景ですが、この作業はいまだにAI開発の現場で行われているのです。
教師データ作成の課題②品質の担保が困難
この作業は非常に大変なので、多くの人数でやろうとするのですが、品質を担保するのが非常に難しいのです。
例えばこの、「ししとうを囲ってください」というシンプルな指示でも、Aさんは柄の部分まで囲っていますが、Bさんは実だけを囲っています。
また、一部が葉で隠れているケースでは、AさんとBさんの作ったデータは、このようにバラバラです。
些細な違いですが、このように基準がバラバラのデータがたった12%含まれるだけで、AIの精度は10%も低下し、AI開発プロジェクトの成否を決めてしまいます。
今、お見せしたししとうの例はシンプルなほうですが、自動運転、医療、製造業などの既存産業では、複雑かつ高度なデータ作成が多く存在します。
そして、1つのAI開発に通常数万件程度の教師データが必要で、これがAI開発のボトルネックとなっているのです。
AI搭載の高品質教師データ作成サービス
FastLabelはこの課題を、テクノロジーで解決します。
具体的には、「AI搭載の教師データ作成サービス」を提供していきます。
特徴①AIが作業者のデータ作成を支援
まず、AIによる作業支援です。
左が通常の方法で、右がFastLabelを使った方法です。
左だと、先ほどと同様に一つ一つ囲っていくのに対し、FastLabelは図形でざっくりと囲うだけで、AIが瞬時に輪郭を切り取ってくれます。
特徴②AIがデータの品質をチェック
また、データの品質もAIでチェックします。
こちらのデータ分析機能から、AIの予測結果と正解データを比較し、間違っていそうなデータを順にソート、AIのサジェストによって効率良く、教師データのミスを修正できます。
特徴③AIが作業者の教育を自動化
そして、作業者の教育も自動化します。
あらかじめシステムに正解データを登録しておくと、システムが作業者に自動でフィードバックを行います。
これらの機能によって、医療系の難しいデータ作成においても、高品質なデータが作成できています。
教師データ作成費用の30~40%をマージンとするビジネスモデル
ビジネスモデルは、FastLabelが発注を受けてパートナー企業が実作業を行い、データ作成費用の約30~40%のマージンをいただきます。
短期間・少量データでAIの精度向上が可能になるのが、導入効果です。
実際、1カ月で2、3割の精度向上に成功した例、当初想定の6分の1のデータ量で目標精度に到達した例もあります。
4月のシード資金調達の発表以降、既にエンタープライズ企業にも導入頂いています。
▶AI革命のインフラを目指す「FastLabel(ファストラベル)」のシードラウンドにおいて出資(財経新聞)
AI専門の会社だけではなく、多くの産業、事業会社でAIの社会実装が進んでおり、FastLabelが利用されています。
それに伴い、売上も順調に推移しています。
インバウンド需要と展示会で効率良く顧客を獲得し、コンペ勝率も約85%と高い数値です。
AIとエンジニアリングに強いチーム
チームについて、お話しします。
私はもともと早稲田大学の大学院で、機械学習のアルゴリズムを研究していました。
その後はワークスアプリケーションズで5年間、エンタープライズのソフトウェア開発とAIプロジェクトの社会実装を経験しました。
今回紹介したデータ作成時の課題は、まさに自分が経験してきたペインでもあります。
正社員は5名ながらも、AIとエンジニアリングに強いチームができつつあります。
AI開発を支援するSaaSを提供し、事業の多角化を目指す
成長戦略としては、現在、教師データ作成サービスをメインに提供していますが、AI開発全体を支援するSaaSを提供してまいります。
既に一部機能の提供を開始しており、有償ユーザーもついています。
これらの領域(スライド右)全てをカバーできると、教師データ作成だけでAIができるようなサービスが提供可能になります。
これにより、教師データ作成市場から、AI市場そのものを捉えることができるようになります。
そんな夢のようなことができるのかと思う方もいるかもしれませんが、既に、既存のAIプラットフォーマーと連携することで、そんな仕組みができています。
▶アノテーションプラットフォームの「FastLabel」がヘッドウォータースのマルチAIプラットフォーム「SyncLect」と連携を開始(PR TIMES)
最終的には、このAI基盤をもとに、事業の多角化を目指します。
AI開発で遅れをとる日本を一気にAI先進国に!
最後に、FastLabelが目指すところについてお話しします。
日本は経済成長がほぼない中で労働人口が減少しているため、AIの導入が急務です。
▶「日本はAI後進国」「早く自覚してほしい」 ソフトバンク孫社長が憂慮(ITmedia)
しかし諸外国と比較すると、日本は既にAI開発で大きな遅れをとっています。
一方で世界に目を向けると、データ品質の課題はいまだに、AI実用化の壁になっています。
私は、日本がAI先進国になるチャンスは、まだまだあると思っています。
高品質な教師データを迅速に提供するインフラの開発を我々が担うことで、日本を一気にAI先進国にします。
FastLabelには、そんなポテンシャルがあります。
既存産業におけるAI革命はこれからが本番です。
AI革命のインフラになるFastLabel、どうぞご支援のほど、よろしくお願いいたします。
(終)
▶新着記事を公式LINEでお知らせしています。友だち申請はこちらから!
▶ICCの動画コンテンツも充実! YouTubeチャンネルの登録はこちらから!
編集チーム:小林 雅/小林 弘美/浅郷 浩子/戸田 秀成/大塚 幸
更新情報はFacebookページのフォローをお願い致します。