音声および音響信号処理

アナログ・デバイセズLISTN—重要な音を聞く

アナログ・デバイセズは、没入感のある車内オーディオ体験が、車を購入する際の主な差別化要因の1つであることを理解しています。

インフォテインメントから人や機械(Siri、Alexa、OK Googleなど)とのハンズフリー通信に至るまで、アナログ・デバイセズは、その高度なIPを利用して、オートモーティブ業界の最高度の規格を満たす高性能マイクロフォン・オーディオ信号処理ソフトウェア・ソリューションのポートフォリオ、ADI LISTNを開発しました。

成熟したIPが数百万台にのぼる車に搭載されているため、この信頼性の高いソフトウェア・ソリューションは統合とチューニングが簡単で、市場投入までの時間を短縮できます。

アナログ・デバイセズは、常に、オーディオ信号処理ソフトウェア・ソリューションのポートフォリオを大きく拡張しています。すべてのADI LISTNマイクロフォン・オーディオ信号処理ソフトウェア・ソリューションは、SigmaStudio®における構成要素として、また、CrossCore® Embedded Studio(CCES)と統合するためのライブラリとして、アナログ・デバイセズのSHARC® DSPで使用できます。あるいは、必要に応じて任意のツール・チェーンで使用してサードパーティのCPUまたはSoC上でコンパイルすることもできます。

アナログ・デバイセズのLISTNの高性能に関するメリット

  • 柔軟性があり、カスタマイズ可能で、あらゆるハードウェア・プラットフォームをサポートする業界をリードするソフトウェア。
  • リソース効率が高く最適化されたハードウェア実装を可能にし、高品質の音声信号処理と低遅延で決定論的性能を実現する。
  • Apple CarPlayやGoogle Androidなどの複数の自動車用途向け認証に合格できる、最高水準のオートモーティブ規格(ITU-T p.1100/1110/1120/1140)への準拠を可能にする。
  • その他の既存のソリューションと比較して評価時間を短縮することで、市場投入を迅速化する、使いやすいチューニング・ツール。
  • 20を超える特許が出願されている—アナログ・デバイセズのLISTNは、比類のない性能を実現する独自の位置づけにあり、人間のコミュニケーションだけでなく、認識エンジンが音声を受信する前に音声を処理するときにも、エラー率を最小限に抑え、優れた車内体験を提供できる。

音声認識

音声認識のあらゆる側面で、すべての使用例(高速、音楽再生、同乗者との会話など)で満足のいく性能を発揮する高品質の音声処理が求められます。アナログ・デバイセズの最先端のソリューションは、音声前処理(AEC/NR/BF)アルゴリズムと組み合わせて、あらゆるオートモーティブ関連のお客様に最適な製品を提供します。

アナログ・デバイセズの音声認識用ウェイクアップ・ワード・ソリューションは、アナログ・デバイセズのLISTNの一部であり、オートモーティブ・インフォテインメント・システムの最新の業界標準をサポートしています。

Voice recognition graphic on smart car dashboard

車内通信(ICC)

アナログ・デバイセズの高度なIPの直接的なメリットの1つは、車内通信です。ICCは、処理されたマイクロフォン信号が離れた受信エンティティに送信されず、車内のスピーカーに出力される、音声帯域のオーディオ使用例です。これには非常に低遅延の信号処理が必要です。そうでなければ、スピーカーの出力がスピーカー自体の音声のエコーとして認識されてしまいます。

クローズドループの状況では、ハウリングまたはリンギングと呼ばれるフィードバックのリスクを負います。このようなリスクは、ICCアルゴリズムによって制御する必要があります。ICCは、前後方向(単方向)のコミュニケーションの際に最も重要です。これによって、ドライバーは振り返らずに後部座席の同乗者と簡単に話すことができるのです。ただし、背面から前面へのサポートを追加して、双方向で実装することもできます。

Interior of car with mother driving and children in the back seat
ICCは、ドライバーが振り返らずに後部座席の同乗者と簡単に話すためには不可欠です。ただし、背面から前面へのサポートを追加して、双方向で実装することもできます。

ICCから派生したのが車内カラオケであり、これはフロントツーフロントICCとしてとらえることができます(ドライバーが自分の歌声を聞きたいからです!)。車内カラオケは通常、ICCよりも大きな音が好まれます。一方で理想的なICCは、同乗者にはほとんど注目されることはありませんが、オフになると不自由に感じられるものです。

アクティブ・ノイズ・キャンセル(ANC)

アクティブ・ノイズ・キャンセル(ANC)は、自動車メーカーが同乗者の快適性を充実させると同時に、自社の車両の差別化を実現できる技術分野として、急速に発展しています。現在、シンプルなエンジン・オーダー・キャンセレーション(EOC)から、更に進歩したロード・ノイズ・キャンセレーション(RNC)まで、多様なANCが開発されています。アナログ・デバイセズでは、実装方法やアーキテクチャに縛られることなく、DSP、オートモーティブ・オーディオ・バス(A2B®)、MEMs XL、および関連ソフトウェアなど、中核的な技術競争力を活用した、効率的かつコスト最適化されたシグナル・チェーン・ソリューションを提供しています。

Active noise cancellation applied to cabin of SUV
ANCアプリケーションは、不要な外部エンジン・ノイズを「聞き取り」、位相が180°異なる音を発生して、ノイズが車内の人の耳に届く前にそれを「除去」します。

A2Bに接続されたデジタル・マイクロフォンは、アナログの競合品に比べ、音質や音声認識率が向上しているため、急速に業界標準となりつつあります。システム性能を最適化するために不可欠な遅延が少なくまた確定的であるという特長を備えているため、音声アプリケーションや音響アプリケーションにA2B技術を採用するOEMがその数を増しつつあります。更に、A2Bのデイジーチェーン・アーキテクチャは、代表的なRNCアプリケーションに見られる複雑な配線が大幅に簡素化されており、配線コストと配線重量を最大で75%も削減します。

A2B®がどのようにして最小遅延のデジタル・オーディオ、制御、消費電力を簡単な設計で提供でき、音声およびオーディオに対し革新的なアーキテクチャを実現できるのかを、Ken Waurinが説明します。

音声信号処理ソフトウェア・アルゴリズム

アコースティック・エコー・キャンセリング(AEC)、ノイズ・リダクション、およびビームフォーミングは、アナログ・デバイセズのLISTN音声信号処理ソフトウェア・スイートの主要なアルゴリズムの要素です。これらの技術は、アナログ・デバイセズの音声処理ソリューションの基礎であり、真に没入感のある車内体験を実現する上でメーカーが必要としているものです。

アコースティック・エコー・キャンセリング(AEC)/ノイズ・リダクション技術

様々な外乱がスピーカーの音声信号に干渉するため、精巧な信号処理がなければ、人間間のコミュニケーションも機械との通信も行うことができなくなります。

AECとNRは、車内のスピーカー出力および走行ノイズの2つの外乱信号成分を制御します。スピーカー出力のソース信号は既知であるため、これらの外乱は2段階のプロセスでマイクロフォン信号から完全に取り除くことができます。

線形エコー・キャンセリングは、スピーカーとマイクロフォンの間のインパルス応答を計算する適応型アルゴリズムです。エコーの推定値が計算され、マイクロフォン信号から差し引かれます。非線形残留エコー抑制は、線形キャンセリング後に残っているエコーを除去します。これは、人間の耳が自分の声のエコーに非常に敏感であるためです。

その他の遍在する外乱(走行ノイズ)については、走行中の車では時間の経過と共にゆっくりと変化すると想定されます。そのため、適応的に計算されたノイズの推定値は実際の現在のノイズの内部表現となり、NRアルゴリズムによって最大で20dB削減されます。

ビームフォーミング技術

ビームフォーミングは、アレイとして配置された2つ以上のマイクロフォンから開始されます。車内の音の空間情報が考慮されるため、様々な方向の音の影響を区別することができます。

ビームフォーミングを使用すると、特定の座席位置に焦点を合わせ、車内のその他の音声を減らすことができます。干渉するその他の音声は音声認識性能を大幅に低下させる可能性があるため、これは音声認識に役立ちます。人間のコミュニケーションについては、ビームフォーミングは、非定常ノイズ成分がオフビーム方向から来る場合にそれらを低減できるため、ノイズ・リダクションのアドオンとして役立ちます。


当社の音声処理技術のデモンストレーションをお聞きください。


アナログ・デバイセズのLISTNは、アナログ・デバイセズのSHARCおよびSigmaDSPプロセッサだけでなく、サード・パーティのSoCでも動作するため、お客様は好みのシステム・アーキテクチャを自由に選択することができます。

アナログ・デバイセズのLISTNをアナログ・デバイセズのA2B®(オートモーティブ・オーディオ・バス)技術と組み合わせて使用すると、デイジー・チェーンを介した信号クロックの再生成を排除することにより、時間同期を活用できます。そして最終的には、全体的な部品表コストを削減し、マイクロフォンの配線スキームを簡素化することで、完全なターンキー・ソリューションを実現します。

音声信号処理ソフトウェア・ツール


アナログ・デバイセズのLISTNチューニング・ツール

アナログ・デバイセズのLISTNチューニング・ツールは、イーサネット、UART、またはSPIを介してターゲットに接続するグラフィカル・ユーザ・インターフェース(GUI)です。アナログ・デバイセズのLISTNオートモーティブ音声信号処理スイートとそのチューニング機能を使用すると、ITU-T p.1100/1110/1120/1140やApple CarPlayなどの関連するオートモーティブ仕様に合格するシステムを簡単に作成できます。

アナログ・デバイセズのLISTNチューニング・ツールをダウンロード

ADI LISTN Tuning Tool graphical user interface

SigmaStudio graphical user interface

SigmaStudio

SigmaStudio®グラフィック開発ツールは、SigmaDSP®とSHARCオーディオ・プロセッサ、A2B(オートモーティブ・オーディオ・バス)トランシーバー用のプログラミング、開発、チューニングを行うためのソフトウェアです。使い慣れた音声処理ブロックを回路図のように接続することができます。また、コンパイラがDSP対応のコードとコントロール・サーフェスを生成するため、パラメータを設定してチューニングできます。

SigmaStudioを入手する

CrossCore Embedded Studio graphical user interface

CrossCore® Embedded Studio(CCES)

CrossCore Embedded Studioは、アナログ・デバイセズのBlackfin®、SHARC、ARM®プロセッサ・ファミリに対して世界レベルの統合開発環境(IDE)を提供します。CCESは、BlackfinおよびSHARC開発者に、ドライバ、サービス、およびアルゴリズム・ソフトウェア・モジュール用の高度に統合されたアドイン・サポートも提供します。

CrossCore Embedded Studioを入手する