自動化、自動運転に向けたAI導入の現状と課題（後編） [自動運転を支えるAI技術]

株式会社コーピー創業者兼CEO　山元浩平氏

～完全自動運転の実現に向けて進化するAI～

ここ数年、自動車産業に大変革をもたらすものとして「CASE」というキーワードが使われています。これはダイムラーのディーター・ツェッチェCEOが提唱した造語で、それぞれ「Connected：コネクテッド」、「Autonomous：自動運転」、「Shared/Service:シェアリングとサービス化」、「Electric：電動化」の頭文字をとっています。このうち2番目の「自動運転」の実現に向けては、AI（人工知能）を使った画像認識システムが、安全性を左右する重要技術として注目を集めています。

今回のAIに関する連載では、前編として「製造業のミッションクリティカルな領域にAIを導入するために必要な技術」を中心に、株式会社コーピーの創業者兼CEOである山元浩平氏にお話を伺いました。後編では、「自動運転の実現に向けて解決すべき課題」について、お話を伺います。（執筆：後藤銀河、写真・画像提供：株式会社コーピー）

＜プロフィール＞
山元浩平氏
東京大学大学院情報理工学系研究科博士課程中退。東大、Yahoo!Japan研究所、フランス国立情報学自動制御研究所Inriaなどで機械学習に関する研究を行い，東大やInriaの同僚と共に2017年3月、株式会社コーピーを創業。

関連する研究分野は、ディープラーニング、マルチメディア（画像／言語）、Web（推薦システム／オンライン広告／UIUX最適化）など。これまでに推薦システムの最高峰国際会議RecSysのワークショップや、Webの最高峰国際会議WWWなどで研究発表を行ってきた。またYahoo!Japan研究所では、ディープラーニングを用いたオンライン広告のクリック率予測技術を開発し、特許を取得。

――自動車用，特に自動運転に向けて開発されているAIシステムをご紹介いただけますか？また、特にどのようなところが難しいとお考えですか？

［山元氏］自動走行車向けの取り組みは自動車企業との協業によるものがほとんどであるため、紹介できないものが多いのですが、既に我々が対外発表しているものの中の一部を紹介すると、例えば、画像認識システムの精度を向上させるための画像を生成する画像生成システムと、生成した人工的な画像を使って実際の認識精度を向上させることができるアルゴリズムの研究開発に取り組んでいます。

自動運転における画像認識開発の難しさ

［山元氏］製造業の外観検査と異なり、自動運転用のテストデータは、全てのデータを網羅的に集めるのはほぼ不可能です。雨の日や雪の日、気象条件もどんどん変化しますし、道路の状況にしても、日本の道路とカリフォルニアの道路では、まったく環境も違ったものになります。そのため、例えば雨滴や泥が付いた画像を、CG（Computer Graphic：コンピューターグラフィック）やGAN（Generative adversarial network：敵対的生成ネットワーク）によって、大量の人工データとして作成・学習させるわけです。

自動車部品メーカーとCGやGAN※（敵対的生成ネットワーク）などの技術を活用し生成した画像。写真提供：株式会社コーピー

［山元氏］ただ、人工データもリアルではありませんから、いくら多量の人工データを学習したからといって、それだけで現実での認識精度が高まるというものではありません。そのため、人工データを活用することで、現実における認識精度を高めることができるアルゴリズムの研究を、合わせて取り組んでいます。

世界中の自動車が走行する状況をカバーする全てのデータを集めてくることは事実上不可能です。そこでこうした人工データを自動で大量に生成する技術と、それによる学習アルゴリズムの開発、これを同時並行で進めていくことが重要になってくると考えています。

――自動生成する人工的なデータはあくまでも人工的であり、リアルとは違うと。そこで人工データを利用してリアルの精度を高められるアルゴリズムが重要になるということですね。自動車関連のシステムは他にどのようなものがありますか？

［山元氏］自動走行車向けに、「未知の路上障害物を検出するシステム」を開発しています。通常の物体検出では、映像の中の「人」や「自動車」を明示的にアノテーションし（学習するための教師として与える）、「人」や「自動車」を認識できるように教師あり学習していきますが、未知の障害物は、路上に落ちている未知の「何か」なので教師を明示的に与えることが難しいです。こうした正解がないケースでは、教師なし学習や半教師あり学習、データ拡張のようなアプローチをうまく組み合わせて、頑健なシステムを構築する必要があります。

単眼カメラを使用し未知の物体を頑健に検出する様子。写真提供：株式会社コーピー

［山元氏］未知の障害物が認識できるようになれば、自動運転以外にも応用が可能です。例えば車載カメラを用いて未知の障害物を検知し、それをGPSの位置情報と紐づけて地図上にマッピングすることで、高速道路の管理会社は効率よく速やかに路上落下物の回収ができ、高速道路利用者の安全を守ることができます。これらの技術は、もちろん鉄道等にも活用できると考えています。

他にはコネクテッドカー向けで自動運転と直接関係しているわけではありませんが、「マルチモーダル検索システム」というものがあります。自動車にはCANデータといわれる制御用に使っている様々なセンサーデータや画像データがあり、それがコネクテッド機能によって取得され、どんどんデータセンターに集積されていくことになると思います。ただ、こうした多量のデータは非構造化データなので、利用しようとしても扱いが難しいという課題があります。

CASEの最初の1文字はコネクテッド。自動運転に関連したカメラやセンサーからも大量のデータが送られてくることになる

［山元氏］そこで、車の周りの環境や行動といった情報を「文章」として記述すると、それに対応するシーンのオンボードカメラの映像や車のセンサーデータを検索できるようなシステムを開発しています。自動車メーカー各社は、コネクテッドカーを使ったモビリティデータを起点として、いろいろなサービスを提供するMaaS（Mobility as a Service）を作りたい、という戦略がありますから、そうしたところで活用できるシステムになると考えています。

――ありがとうございます。前回、ミッションクリティカルな領域にAIを導入するというお話を伺いましたが、自動運転はまさにミッションクリティカルな機能です。AIとして必要だと指摘された品質保証ですが、そもそもAIの品質保証が難しい理由はどこにあるのでしょうか、改めて教えてください。

AIシステムの性質を正しく理解することが大切

［山元氏］AIシステムは、要求から要件や仕様を定義して開発する「演繹的アプローチ」を取る従来のシステムとは異なり、要求のみを決めてデータから学習することによって開発を行う「帰納的アプローチ」をとるため、本質的に品質保証が難しいのです。

より正確には、データは「訓練データ」、「検証データ」、「テストデータ」に分けられ、訓練データと検証データを用いて、パラメータとハイパーパラメータを学習して、AIモデルを作成します。そして、検証データでAIモデルの精度を測り、最後にテストデータでふたたび精度を測ります。

パラメータは最適化アルゴリズムによって最適化され、ハイパーパラメータは人が手動で最適化します。検証データとテストデータでそれぞれ精度を測る理由は、モデルの汎化性能を判断するためです。

例えば、精度が検証データで90%、テストデータでも90%であれば問題ありませんが、テストデータでの精度が50％しか出ていない場合、AIモデルが検証データだけに過学習しているため、良いモデルとは言えません。こうしたところが、本質的に品質保証が難しいとされる理由です。

――AIを導入する、と言葉で表すとシンプルですが、エンジニアとしてAI導入に際して心がけるべきことは何なのか、最後にアドバイスとしていただけますでしょうか。

［山元氏］これからAIは進化し、自動運転はもちろんのこと、多くの産業で身近になっていくでしょう。AIエンジニアでなくてもAIを活用して課題を解決していくようになるはずです。

機械系や電気系のエンジニアだとしても、身の回りの様々な関連領域で、AIによる自動化の導入が進められていくと思います。別にAIのプロフェッショナルになる必要はありませんが、こうしたAI独自の特性を理解し、人が行うところ、従来のシステムが行うところ、AIが行うところをきちんと整理していくことができれば、導入におけるリスクを抑えながら、AIをうまく活用していくことができるのではないでしょうか。

取材協力

株式会社コーピー

ライタープロフィール

後藤　銀河
アメショーの銀河（）をこよなく愛すライター兼編集者。エンジニアのバックグラウンドを生かし、国内外のニュース記事を中心に誰が読んでもわかりやすい文章を書けるよう、日々奮闘中。

The post 自動化、自動運転に向けたAI導入の現状と課題（後編） [自動運転を支えるAI技術] first appeared on fabcross for エンジニア.

TechWatch