【NEW】ICC サミット FUKUOKA 2024 開催情報詳しくはこちら

3.Googleが実証した「データ」と「計算機資源」を持つものが勝つということ

平日 毎朝7時に公式LINE@で新着記事を配信しています。友達申請はこちらから!
ICCの動画コンテンツも充実! Youtubeチャネルの登録はこちらから!

「量子コンピューティングで実現する社会」7回シリーズ(その3)では、クライス&カンパニーの及川氏がGoogle在籍時代に気づいた「データと計算機資源を持つ者が勝つ」という理由を語ります。量子コンピューター時代には、従来とは違う考え方が必要だとか。ぜひご覧ください。

▶ICCパートナーズではコンテンツ編集チームメンバー(インターン)の募集をすることになりました。もし興味がございましたら採用ページをご覧ください。

ICCサミット FUKUOKA 2018のプラチナ・スポンサーとして、IBM BlueHub(日本アイ・ビー・エム株式会社)様に本セッションをサポート頂きました。

ICCサミットは「ともに学び、ともに産業を創る。」ための場です。毎回200名以上が登壇し、総勢800名以上が参加する。そして参加者同士が朝から晩まで真剣に議論し、学び合うエクストリーム・カンファレンスです。次回 ICCサミット KYOTO 2018は2018年9月3日〜6日 京都市での開催を予定しております。


【登壇者情報】
2018年2月20-22日開催
ICCサミット FUKUOKA 2018
Session 3E
量子コンピューティングで実現する社会
-Quantum Opportunityで捉えるビジネス-
Supported by IBM BlueHub

(スピーカー)
及川 卓也
株式会社クライス&カンパニー
顧問

小野寺 民也
日本アイ・ビー・エム株式会社
東京基礎研究所 副所長 技術理事

草野 隆史
株式会社ブレインパッド
代表取締役会長

山田 貴士
株式会社LIFULL
取締役執行役員 LIFULL HOME’S事業本部長 兼 LIFULL技術基盤本部長

(モデレーター)
尾原 和啓
IT批評家、藤原投資顧問書生

「量子コンピューティングで実現する社会」の配信済み記事一覧

最初の記事
1.量子コンピューターの「現在」と「未来」をIBMのエキスパートが解説!

1つ前の記事
2.LIFULL HOME’Sは物件画像の真贋を深層学習で判断している

本編


尾原 中身を詰めていくのがこのセッションなので、まずは及川さんにマイクをお渡ししてから、議論を深めていきましょうか。

及川 卓也氏 (以下、及川) こんにちは、及川と申します。

本日はよろしくお願い致します。


及川 卓也
株式会社クライス&カンパニー
顧問

大学を卒業後、外資系コンピュータメーカを経て、マイクロソフトにてWindowsの開発を担当。Windows Vistaの日本語版および韓国語版の開発を統括した後、Googleに転職。ウェブ検索やGoogleニュースをプロダクトマネージャとして担当。その後、Google ChromeやGoogle日本語入力などのプロジェクトをエンジニアリングマネージャとして指揮する。2015年11月より、プログラマーのための情報共有コミュニティサービスQiitaを運営するIncrementsにてプロダクトマネージャとして従事後、独立。2017年6月より、クライス&カンパニー顧問のほか、スタートアップを中心とした複数の企業へプロダクト戦略やエンジニアリング組織作りなどでの支援を行う。

『007』という映画があります。

尾原 はい?

及川 あれに「Q」という人が出てくるんです。

尾原 あ~確かに!

及川 あの俳優によく似ていると言われるんです。

(会場笑)

▶編集注:『007』Qの画像検索結果

尾原 何だ、自分の上げから入るんですね (笑)。

及川 はい、すごく似てるって言われるんです。

尾原 確かに!Googleの中で何か困ったことがあれば及川さんって感じだったから似ています。

及川 それもそうですし、顔が似てるって言われて、どうでもいいのですが、及川でございます(笑)。

Google勤務で得た「データがすべて」という実感

及川 今「Google」という言葉が出ましたが、尾原さんとはGoogleの時の同僚でして、最後の方は、Chromeの開発リーダー、マネージャーをしていました。

今いろいろな会社のお手伝いをしているのですが、どの会社もやはりデータと機械学習を使って、それをサービスに組み込んでいくということが当たり前のようになってきていますので、「データがすべて」だなと思っています。

そのデータの威力を感じたのは、Googleにいた9年間です。

「AI」という言葉をずっと使っていますが、「AI」というのは実は一時恥ずかしい言葉でした。

一時AIが流行り、冬の時代になり、第2次ブームがあって、その頃に私はちょうど社会人になったのですが、その後また冬の時代が来ました。

その時に皆、恥ずかしがって「AI」という言葉を使いたがらなくなってしまいました。

Googleがやっていることは、実はAIと呼ばれることだったにもかかわらず、当時は社内でもあまりそう呼んでいませんでした。

ただ蓋を開けてみると、Googleという会社は創業時から、基本的にデータを使ってAIをずっとやってきた会社です。

そして、それだけのデータが集まっているということが、プラットフォーマーとしてのあの支配的な地位を持っていることに繋がっているのだと思います。

私はいろいろな会社に組織作りの支援という形でアドバイザーとして入ることも多いのですが、Googleがすごいと思う点は、データをもってしてプラットフォーマーとして支配的な位置を占めていることとともに、技術者を集めていることです。

草野さんもご存知だと思いますが、データサイエンティストはデータがないとやることがなく、面白味がありません。

Googleは、ウェブ上のコーパスを全部持っている会社です。

そのため自然言語処理ということを考えると、「他の会社がそれだけのコーパスデータを持っているだろうか?」という疑問がエンジニアにはあり、そうすると優秀なエンジニアはなかなか辞めません。

もちろん待遇が優れているという要因もあるのですが、それだけではなく、自分がエンジニアとして、リサーチャーとして何がやれるかと考えた時にそこには「データ」が必要です。

あともう1つは分かりますか?

それは「計算機資源」です。

「データ」と「計算機資源」を持つ者が勝つ

及川 Googleというのは、この計算機資源の点においても恐らく世界でトップです。

データと計算機資源の2つが揃っていたら、やりたいことがやり放題なわけで、辞めません。

いくら自分が優秀なエンジニア、リサーチャーであったとしても、データがなくなった途端、何もできません。

今の機械学習が出てくる前に、私はIME(Input Method Editor)にも携わっていました。

「Google日本語入力」と言われています。

カナ漢字変換と言った方が昔の人には分かりやすいかもしれませんが、あれも作りました。

カナ漢字変換、IMEというのは、ジャストシステム社、マイクロソフトやアップルには、辞書を編纂するための専門のリンギストのような人がいて、国語辞典を作るような形で単語登録をして辞書を作っています。

しかし、Googleの日本語入力というのはそれを一切やっていません。

全部機械にやらせているのです。

先ほど言ったように、ウェブ上のデータを集めていますから、それを統計的機械学習に突っ込んで辞書を作っています。

そしてここで使っているアルゴリズムというのは、今は知りませんが、私が携わっていた時は実は極めて古典的なことをやっていただけでした。

NLP(Natural Language Processing:自然言語処理)の分野でトップクラスのリサーチャーといいますかエンジニアがいるのですが、その機械学習を研究室レベルでやった時にはクオリティが上がらなかったと言っていました。

けれども、大量のデータを食わせたら普通に使えるものになったんです。

こういうことが平気で起きてしまうのです。

要は、「データ」と「計算機資源」を持っている者が勝つということを、もう10年近く前からGoogleは実証していて、その延長に今があるという形です。

ですから、今いろいろなところでお手伝いしていますが、「データを集めましょう、データを使いましょう」と伝えています。

単にデータがあるだけでは駄目で、データクレンジング(データの重複・誤記・表記の揺れなどを探し出し、削除・修正・正規化などを行うこと)などと言われているように、どのようにデータを集め蓄積するかが重要です。

これは本当に難しいのですが、「集める時にどう使うかを考えて集めましょう」と王道の発言をするものの、最終的にどうデータを使うか分からないため、何を集めていいか分からないという、「鶏が先か、卵のが先か」の状態にもなり得ます。

それでも、データの使い方と集め方を考えていかなくてはならないということで、いろいろな会社でお手伝いしています。

その中で、データを活用する企業になるには、組織がどうあるべきかという議論も往々にして出てきます。

時代が量子となった時に必要な組織の在り方も全然違うだろうと感じています。

「量子脳」を作っていこう

及川 先ほど会場に量子コンピューターを触ったことがある人がいるかと聞いた時には手が上がりませんでしたが、私はやはり予習しようと思って触ってみました。

尾原 偉い!

及川 IBM社がクラウドで提供している「IBM Q Experience」という環境があり、そこで使ってみたました。

私は一応技術者ですし、理系の人間ですが、一生懸命勉強すれば勉強するほど、量子というのは本当に全く訳が分かりません。

しかし、5年後か10年後かに量子コンピューターが出てくるときにそれを活用するためには、今までの古典的なコンピューターとは違う脳にならなくてはいけないと考えています。

先ほど控え室で「量子脳」と言ったらウケたのですが、何かやはり「量子の考え方」のような脳が必要かなと思っていています。

実際に皆さんの会社が量子コンピューターをいつ使うかというと、まだ先だとは思います。

ですが、量子脳になっていくこと、量子脳のエンジニアなり、タレントを集める組織にしていくというのは、今からでも取り組んでいった方がいいのではないかなということを考えています。

(続)

次の記事を読みたい方はこちら

続きは 4.量子コンピューターの宝の山はどこにあるのか? 量子アルゴリズムの発見と、それで解ける問題の発見だ をご覧ください。

平日 毎朝7時に公式LINE@で新着記事を配信しています。友達申請はこちらから!
ICCの動画コンテンツも充実! ICCのYoutubeチャネルの登録はこちらから!

編集チーム:小林 雅/戸田 秀成/本田 隼輝/浅郷 浩子/尾形 佳靖/鈴木ファストアーベント 理恵

【編集部コメント】

及川さんに、データビジネスにおける「データ」と「計算機資源」の重要性を解説いただきました。では、圧倒的な計算機資源が普及した未来でも、「データ」を持つ企業が勝者となるのでしょうか? 次回はそんな問いかけから量子時代のビジネスの議論へと展開していきます。ぜひご覧あれ!(尾形)

他にも多く記事がございますので、TOPページからぜひご覧ください。

更新情報はFacebookページのフォローをお願い致します。

この記事が気に入ったら
いいね または フォローしてね!