車載インフォテインメント機器に最適なジェスチャ制御技術

2021年11月30日

要約

車載インフォテインメント機器をジェスチャで制御できるようにすれば大きなメリットが得られます。具体的には、ドライバにとってのユーザ・エクスペリエンスや安全性を高めることができます。なぜなら、タッチスクリーンや手の届きにくい場所にあるダイアルを操作する際に、注意力が散漫になるのを避けることができるからです。つまり、タッチスクリーン、音声、ノブによる操作をジェスチャ制御で補完すれば、ドライバは運転に集中することが可能になるということです。そうした機能の実現手段としては、ToF（Time of Flight）カメラを利用する方法が考えられます。確かに魅力的な選択肢ではありますが、ToFカメラは高価です。また、ToFカメラをベースとするジェスチャ制御システムでは、非常に多くの演算を実行する必要があります。このような課題を解決するために、アナログ・デバイセズは、ToFカメラを利用する手法に代わる革新的なソリューションを生み出しました。そのソリューションでは、光学系、センシング機能、アナログ・フロント・エンド（AFE）を1つのASICとして統合しています。そのため、コストを大幅に削減することができます。それだけでなく、様々な価格帯の自動車において、ジェスチャによる制御という重要な技術の採用を促進することが可能になります。

はじめに

従来、車載インフォテインメント機器をジェスチャによって制御する機能は、高級車でしか利用することができませんでした。上述したとおり、ジェスチャを認識して機器を制御する機能を導入すれば、ドライバにとっての安全性と快適さが高まります。なぜなら、ドライバは、道路から目を離して、タッチスクリーンやダイアルを操作しなくても済むからです。つまり、事故につながりかねない危険を冒す必要がなくなるということです。実際、ジェスチャ制御によって、音量や風量を調整したり、手を振るだけで電話を切ったり、手首をサッと動かすだけで音楽のプレイリストを変更したりすることができれば非常に便利です。ジェスチャによる制御機能を導入すれば、タッチスクリーンによる操作を最小限に抑えることが可能になり、注意力が散漫になるのを防ぐことができます。また、音声などによる制御を補完することが可能になります。

例えば、あるドライバがお気に入りの曲を再生するようバーチャル・アシスタントに指示したとします。その際、ジェスチャによる制御が可能であれば、視線を道路に向けたまま、手を回転させるだけで音量を上げるといったことを実現できます。もちろん、ジェスチャ制御ではなく、音声認識を利用して同じ機能を実現することも可能でしょう。しかし、音声認識を使用するには、あらゆる言語や方言を解釈するために、LTEなどを介してクラウドに存在するプロセッサにアクセスしなければなりません。また、大規模なデータベースも必要になります。加えて、音声認識は、窓やサンルーフが開いていたり、車内で流れる音楽の音量が大きかったりすると利用するのが困難になります。ジェスチャによる制御であれば、そのような問題は生じません。また、ジェスチャ制御を導入すれば、安全性が向上するだけでなく、発声障害が原因で音声認識を利用できない方にもメリットがもたらされます。タッチパネルを操作する際には、非常に注意力が散漫になります。ドライバはボタンの位置を記憶しておく必要がありますし、ディスプレイ上で指を移動する際には触覚に頼らざるを得ません。更に、タッチ操作を利用するシステムでは、ディスプレイの表面が摩耗によって劣化する可能性があります。ジェスチャ制御を導入すれば、そうした問題は生じません。

しかし、従来のジェスチャ制御技術は非常に複雑で、機能の実現には多くのコストがかかっていました。そのため、ジェスチャ制御の機能を採用できるのは高級車などに限られていました。同技術がもたらすメリットについて考えると、中級車や低価格車に利用を拡大するためにあらゆる努力を行う価値が十分にあります。このような考え方に基づいて、全く新たなソリューションが開発されました。本稿では、まずそのソリューションがターゲットとする代表的なアプリケーションについて説明します。その上で、高度な統合技術によって高い費用対効果を実現する革新的なアプローチについて解説します。そのソリューションを採用すれば、非常に多くの自動車でジェスチャ制御を利用できるようになります（図1）。

図1. ジェスチャ制御が可能な車載インフォテインメント機器

ToFカメラを利用した従来のシステム

図2に示したのは、ToFカメラを利用する従来のジェスチャ制御システムです。この構成は、ToFカメラを使用して3Dのシーンの識別とスキャンを行う代表的な例だと言えるでしょう。ToFカメラは、分析の対象となる物体に赤外線ビームを照射し、対象物で反射した信号を取得します。その信号をAFEが受け取り、アプリケーション・プロセッサでデータを処理することによってジェスチャを認識します。

図2. ToFカメラを利用したジェスチャ制御システム

この種のシステムでは、多くのピクセル（6万ピクセル程度）を使用し、目や顔、身体、指を追跡して複雑なジェスチャを認識することによってコンテキストを認識します。その過程では、大量のデータが生成されます。それらに対する処理を行うには、高度なマイクロコントローラ（MCU）が必要になります。カメラと高度なMCUを使用することからシステムの汎用性は高まります。その一方で、システムの価格が高くなるという問題が生じます。ToFカメラをベースとするシステムであれば、多くの種類のジェスチャに対応できる可能性があります。しかし、車載アプリケーション向けのものとしては複雑すぎるとも言えます。お客様がマニュアルを見ながらプログラムを行う必要があり、日常的な使用には必ずしも適していません。

画期的な新技術

車載インフォテインメント機器にジェスチャ制御を適用すれば、シンプルでありながら重要な機能を多くの用途で利用できるようになります。そのため、複雑さとコストを削減するためのあらゆる取り組みを行う価値があります。図3に示したのが、新たなソリューションである統合型ジェスチャ・センサーを利用したシステムです。図中の「MAX25205」というASICは、フォトダイオードのアレイ、光学系、AFEを搭載しています。

図3. 統合型ジェスチャ・センサーをベースとするジェスチャ制御システム

この統合型ジェスチャ・センサーは、SPI（Serial Peripheral Interface）またはI²Cバスを介してシンプルなMCUに接続されます。それにより、ジェスチャ認識の処理が行われます。MAX25205における高い統合度は、光学系に対応する独自のQFNパッケージ（4mm×4mm）を利用することで実現されました。図4に示したのは、このデバイスの断面図です。ご覧のように、この製品には、光学フィルタに加え、ASICに集積されたフォトダイオード（センサー）が含まれています。

図4. MAX25205の断面図。光学系とAFEが統合されています。

フォトダイオードのアレイは、太陽光の放射から保護する必要があります。ここで、図5をご覧ください。波長が940nmのポイントでは、大気中のH₂Oが吸収されることによって太陽光の照度が落ち込んでいます。ここが、このセンサーが動作する波長です。光学フィルタ（ハイパス・フィルタ）は、875nm未満のすべての太陽光を除去する役割を果たします。

図5. 光学フィルタの役割。太陽光の照射からセンサーを保護します。

このセンサーでは、波長が940nmの赤外線LEDを4個使用し、対象物に光を照射します。物体で反射した光は、ASICが備える60ピクセルのフォトダイオード・アレイによって検出されます。ASICには、必要なすべての信号をデジタル化する機能や制御用の機能も組み込まれています（図6）。

図6. 統合型ジェスチャ・センサーのアセンブリ

統合型ジェスチャ・センサーの動作

ここでもう一度、図4をご覧ください。ガラスが設けられた開口部は、光の取り込みを制限するための独自の黒色コーティング層に穴を開けることによって実現しています。大きな開口部を備える疑似的なピンホール・カメラのようなものだと考えればよいでしょう。このアプローチにより、ピントの合った画像ではなく、ぼやけた画像（ブロブ）が生成されます。そのブロブ全体が10×6のフォトダイオード・アレイによって捕捉されます。例えば、赤外線LEDのアレイによって、継続時間が25マイクロ秒、その後の休止時間が25マイクロ秒の一連の光パルスを放射したとします。それに対応し、フォトダイオード・アレイを利用した処理が実行されます。具体的には、照射中の光を積分し、休止中の光を差し引くということが行われます。前者から後者を差し引くことにより、周囲光による共通の成分を除去し、ブロブの強度を推定することが可能になります。総変換周期は20ミリ秒、つまりは50フレーム／秒（FPS）です。各フレーム・データはMCUに送信され、ベクトルの動きを算出するための処理が実行されます。アルゴリズムを利用して、ベクトルのデータが処理され、その結果得られたジェスチャのイベント情報が出力されます。

この手法で使われるピクセル数（60）は少なく抑えられています。それでも、近接した指の追跡や回転の検出など、基本的でありながら重要なジェスチャを認識することが可能です。

アプリケーション回路の例

図7に示したのは、MAX25205を使用したシンプルなアプリケーション回路の例です。これにより、ジェスチャの認識や近接検出を担う低コストのデータ・アクイジション・システムが実現されます。このシステムを使用すれば、以下に示す重要なジェスチャを認識することができます。

手をスワイプするジェスチャ（左、右、上、下）
指や手の回転（時計回り、反時計回り）
近接検出
リンガー・トゥ・クリック
エア・クリック
ウェーブ

センサーからのデータの処理には、低消費電力かつ低コストのCPU（非浮動小数点）が必要です。これには、Arm^®Cortex-M0または他のCPUの余剰計算能力によって対応できます。図7の例では、部品点数が最小限に抑えられています。ご覧のとおり、フィルタ用のいくつかのコンデンサと各赤外線LEDを駆動するディスクリートのMOSFETなどがあれば回路を構成できることがわかります。

図7. 統合型ジェスチャ・センサーのアプリケーション回路図

まとめ

車載インフォテインメント機器にジェスチャ制御機能を適用すれば、安全性とドライバにとってのユーザ・エクスペリエンスが向上します。ToFカメラをベースとした従来のソリューションは、非常に複雑でコストのかかるものでした。そのため、ジェスチャ制御機能の採用は高級車に限られていました。本稿では、ToFカメラをベースとするアプローチの限界について簡単に説明した上で、ジェスチャ認識用の革新的なASICを紹介しました。これを採用してジェスチャ制御機能を実現すれば、コストの高さに悩まされることなく快適なユーザ・エクスペリエンスを提供できるようになります。本稿で紹介したASICは、光学系、センシング機能、AFEを独自の小型QFNパッケージ（側面濡れ性パッケージ）に統合したものです。このASICを安価なCPUと組み合わせることで、ToFカメラよりもはるかに低コストかつ簡素にジェスチャ制御機能を実現することができます。それだけでなく、様々なクラスの自動車やその他の民生用機器におけるジェスチャ制御技術の採用を後押しすることが可能になります。

myAnalogに追加