A2B 技術與數位麥克風如何為新興汽車應用挹注卓越效能

作者:ADI策略行銷經理 Ken Waurin, 資深音訊技術專家Dietmar Ruwisch, 及 Harman International Industries資深聲學工程師Yu Du


介紹

本文將探討近幾年來汽車音訊匯流排Automotive Audio Bus® (A2B®)技術在數位麥克風與連結技術方面的進展。這些創新推動著各界迅速採納各種顛覆局面的應用,促成未來世代的汽車資訊娛樂系統。

市場與應用的版圖

隨著車廠嘗試突顯自家產品和對手之間的差異,通用型音訊、語音、音響等相關應用在汽車座艙電子領域的版圖也逐漸擴大。此外,隨著一般消費者對科技愈加熟悉,他們對駕駛體驗以及人車之間個人化互動的要求也大幅提高。除了家庭劇院品質的音響系統全面普及到所有價位的車款,如今包括精密免持(HF)與車內通訊(ICC)系統也逐漸加入到配備中。此外,主動降噪與道路降噪(ANC/RNC)系統以往僅部署在頂級豪華車款,現在也向下普及到主流平價車款。展望未來,聲波與音響技術將成為Level 4/Level 5自駕車引擎控制單元(ECU)的一項關鍵元件,ECU負責偵測周圍的救難車輛。

所有這些既有與新興應用的共同點,在於它們都依賴高效能聲波感測技術,像是麥克風與加速計。此外由於幾乎所有新興應用都需要多個聲波感測器,像是麥克風(或麥克風陣列)以達到最佳的系統層級效能,因此需要簡單的平價互連技術藉以確保獲得最低的整體系統成本。以往,缺乏針對麥克風進行最佳化的互連技術,一直是各家車廠的一大難題,因為每個麥克風需要透過昂貴又重的類比遮蔽線直接連到處理單元進行雙向傳訊。這些工程都會增加成本 – 主要是實體佈線,其次是增加重量與降低燃料效率 – 許多情況還會導致這些應用無法被廣泛採納,或至少使它們侷限在超高階車款。包括數位麥克風與連結技術近期出現的進步,促成未來世代的車載資訊娛樂系統迅速採納這些顛覆性應用。A2B技術將扮演開創新局的角色。

傳統類比麥克風實作與限制

大多數國家都嚴禁駕駛人一邊開車一邊使用手機,而免持藍牙裝置則成為幾乎所有車款的標準配備。市面上出現各式各樣的免持解決方案,從簡單的獨立型單元,包含喇叭、麥克風等元件構成先進解決方案,完全整合在車載資訊娛樂系統。直到最近,大多數免持聽筒系統型態彼此都相當類似。它們包含一個(極少數配置2個)麥克風,採用的麥克風技術是50年歷史的駐極體式麥克風(ECM)。傳輸音訊的音質往往差強人意,尤其是簡單的獨立型單元,麥克風與發話者口部之間的距離會比較遠。如果麥克風盡可能置於靠近口部位置(像是汽車天蓬),則通訊品質就能改善。不過若是要支援駕駛人與乘客之間的通話功能,前座就必須配置多個麥克風。

典型汽車ECM裝置結合了ECM收音頭,這個密封夾的外殼內裝有小型放大器電路。放大器的類比訊號其電壓值讓傳輸訊號通過數公尺的線路,符合典型汽車環境的需求。如果沒有放大,原始ECM訊號強度就不足以應付這麼長距離的線路,因為訊號雜訊(SNR)會因線路的電磁干擾而衰減得過低。此外,即使是放大後的訊號也需要遮蔽式纜線,通常是雙線式纜線,內含偏壓(8伏)為麥克風裝置供電。由於有這樣的佈線需求,主流車款的ECM裝置數量顯然會受限於重量以及系統成本等因素。

ECM的優點之一,就是內建聲波的指向性,其通常精簡成超心型元件(這種微機電系統麥克風也可做成單向性,但需要更複雜的聲波設計)。一般都可以達到10 dB甚至更高的反向衰減,這裡的 「反向」意謂朝擋風玻璃的方向,來自只有噪音(沒有所要訊號,像是發話者的語音)的聲源方向。在所要訊號的源頭處擁有更高的靈敏度(sensitivity),對於訊號雜訊相當有利。然而,指向性ECM裝置也會衍生許多不利的副作用,像是高通(high-pass)特性,在較低頻率處靈敏度會降低。這類高通響應的3dB 截止頻率通常介於300 Hz到350 Hz之間。在早期的HF高傳真技術時代,高通行為會是一種優勢,因為引擎雜訊主要出現在較低頻率,所以引擎噪聲在麥克風內部傳遞時就已經減弱。然而,自從寬頻或HD電話通訊出現後,高通行為開始成為一項問題。在進行寬頻通話時,有效頻寬的範圍會從300Hz到3400 Hz擴大成100 Hz到7000 Hz。麥克風內建的高通濾波器使得產品必須在後置處理單元中針對100 Hz到300 秒之間的訊號進行放大,但如果麥克風一開始就提供更好的音效頻寬,就不需要這樣的放大程序。

ECM技術的另一項缺點在於靈敏度與頻率響應方面,零件間變異(part-to-part variation)相當大。ECM相對偏高的製造公差在單一麥克風的應用情境也許不會形成問題。但如果超過一個麥克風訊號部署在狹小空間的麥克風陣列時,各個麥克風之間的緊密匹配就會攸關是否能達到最佳的陣列效能。在這種情境中,很少會使用ECM。此外,就實體尺寸而言,傳統ECM受音頭(capsule)通常不適合用在微型化麥克風陣列。

麥克風陣列已拓展出極大的應用版圖,包括許多車用產品,因為它們能提供接近甚至超越傳統ECM的指向性效能。衝擊聲壓(sound impact)方向的空間資訊可利用陣列中兩個或更多個適合麥克風群組從麥克風訊號中擷取出來。這類演算法通常稱為波束成型(BF)。波束成型的名稱沿用自相位陣列天線技術,無線電 「波束」的形成是從天線陣列朝一個特定方向發射,再搭配純線性濾波器與加總演算法。雖然麥克風陣列沒有這樣的波束,波束成型的名稱在麥克風訊號處理領域卻早已廣泛沿用,且採用更多種類的線性與非線性演算法,造就出比純線性波束成型程序更高的效能與彈性。

除了波束成型處理,原始麥克風訊號永遠都需要後置處理,因為每個HF麥克風會在車廂中同時擷取到目標語音訊號以及環境中的各種干擾聲響。包括風、道路、引擎等雜訊都會減損SNR,當訊號開始在喇叭播放 – 通常稱為喇叭回音 – 會形成另一個雜波訊號的來源。為減少這類干擾與改進語音品質,我們需要精密的訊號處理技巧,通常稱為回音消除/噪音抑制(AEC/NR)。AEC 會消除麥克風裡的喇叭噪音,如果沒有AEC這些噪音就會在線路另一端以語音迴音的形態出現。NR除了會減少持續出現的駕車噪音,還會提高傳輸訊號的訊號雜訊。雖然各種精心規劃的規格(像是 ITU-T P.1100 與P.1110),國際電信聯盟(ITU)也針對HF系統定義許多效能規格,但若是AEC/NR處理結果低於品質標準,行駛中車輛的語音通訊品質就無法令人滿意。再加上先前提及的波束成型演算法,AEC/NR/BF的組合造就出種類眾多的新應用,它們都涉及某種程度的數位音效訊號處理。為支援這些應用,業界需要新世代麥克風技術來克服傳統ECM的各項缺點。

數位微機電系統麥克風 —技術與效能的優勢

微機電系統 (MEMS)技術迅速成為麥克風的新業界標準,因為它提供許多超越傳統ECM的優點。第一也是最重要的一點,微機電系統造就規格更小的音效感測器,其體積小於現有ECM收音頭。此外,將MEMS感測器與類比數位轉換器(ADC)整合成一顆IC,讓數位麥克風提供的訊號能供後續AEC/NR/BF處理程序使用。

另外市面上也有配備類比連接埠的MEMS麥克風但內部沒有整合ADC元件,這類產品除了承襲類比式ECM的一些缺點,如果是採用傳統2線式類比介面,其放大器電路甚至比ECM還要複雜。只有用全數位介面技術,延襲自類比線路的干擾與訊號雜訊問題才能顯著紓解。此外,從生產的角度來看,MEMS也是最理想的選擇,因為MEMS麥克風生產的規格變異比ECM收音頭的變異還小,這點對波束成型演算法相當重要。

最後一點,MEMS IC麥克風的製程大幅簡化,因為過程中可採用許多自動貼合(mounting)技巧,藉以降低整體製造成本。從應用的角度來看,更小規格是最大的優勢,由於收音孔(porthole)可以做得非常小,因此MEMS麥克風陣列可以做成幾乎看不見的微型規格。收音孔與連接感測器的音訊通道在設計與製造品質方面需要特別注意。如果阻聲密封(acoustic seal)沒有密實,來自內部結構的噪音就可能傳到感測器,而兩個感測器之間的露洩 (leakage)則可能減損波束成型演算法的效能。典型ECM收音頭在設計與製造方面可能存在差異,像是全向性或單向性的差別,而MEMS麥克風元件不一定都是做成全向性(亦即在收音方面沒有本徵指向性)。因此,MEMS麥克風屬於相位上真實全向性的聲壓感測器,能為各種先進波束成型演算法提供理想訊號,使用者可透過軟體自行設定衰減方向與波束寬度。 一般來說,所有訊號處理模組應配置成一個群組以方便執行整合式演算法。如果各功能模塊相互分隔,處理延遲就會無謂地增加,而整體系統效能則會下滑。舉例來說,波束成型演算法應和AEC建置在一起,最理想的狀況是選用同一家供應商的元件。如果波束成型演算法會對訊號產生任何非線性效應,AEC勢必會產生讓人不滿意的結果。要達到理想的數位訊號處理結果,最好的作法是採用整合式演算法套件,透過這類套件接收未毀損的麥克風訊號。

以下我們詳細比較標準線性波束成型以及ADI專利演算法,藉此詳盡認識先進波束成型演算法的效能潛力。圖1顯示三種不同波束成型演算法在與波束同向(in-beam)與偏離(off-beam)方向的極性特徵與頻率響應。標準線性超心型指向(supercardioid)演算法以一個雙麥克風陣列作為基準(黑線)。基準線顯示最大衰減,包括典型零角方向(最大偏離波束衰減)以及一個180度後波瓣,後波瓣的偏離波束衰減較為緩慢。產生的後波瓣是線性演算法中與波束寬度取得平衡的結果。心型線波束(圖中未顯示)在180度處有最大的衰減,然而,它的受納區(receptive area)比超心型指向組態更加寬闊。運用非線性演算法,可產生後波瓣較不顯著而偏離波束衰減較高的波束,圖中紅線顯示ADI專利式雙麥克風演算法(麥克風間距:20mm)

Figure 1. Polar attenuation characteristic of different BF algorithms.
圖1. 不同波束成型演算法的極性衰減特性 

把兩個全向性麥克風組成陣列,波束形狀一定會出現旋轉對稱。換言之,極座標圖上X°位置上的衰減會和360° – X°位置的衰減相同。這是假定極座標圖上0° 至180° 之間的線相當於一條連結兩個麥克風的假想線。我們把二維的極座標圖沿著這個麥克風軸旋轉,就能得到假想的三維波束形狀。非對稱的波束形狀沒有旋轉對稱性,或者當遇到更窄的波束時就必須至少用三個麥克風排列成三角形。舉例來說,在置於駕駛座天蓬處的典型安裝環境中,雙麥克風陣列能針對來自擋風玻璃方向的噪音進行降噪。然而,在這類方向上,雙麥克風陣列沒有能力去分辨駕駛人和乘客。雖然只要麥克風陣列旋轉90度,就可以分辨駕駛員/乘客,但仍無法分辨來自擋風玻璃方向的噪音和發自車廂內的聲音。只有採用三個或更多全向性麥克風組成的陣列,才有辦法對來自擋風玻璃方向的噪音進行降噪以及分辨駕駛人/乘客的聲音。圖1的綠線顯示ADI專利式三麥克風演算法的極性特徵,當中的麥克風排列成等邊三角形,彼此間距為20mm。1

極座標圖的計算會參考從不同角度傳至麥克風陣列的頻帶侷限白噪音。音響頻寬侷限在100 Hz到7000 Hz的範圍,這也是尖端手機網路的寬頻(或HD語音)頻寬。圖2比較不同種類演算法的頻率響應曲線。在與波束同向的方向,所有演算法的頻率響應和預期一樣在目標音效頻寬上維持平坦曲線。偏離波束方向的頻率響應則是針對偏離波束的半球(90° 到270°)進行計算,在較廣的頻率範圍執行高效的偏離波束衰減。

Figure 2. In-beam (dashed lines) and off-beam (bold lines) frequency responses of different BF algorithms.
圖2. 不同波束成型演算法中波束同向(虛線)與偏離波束方向 (粗線)的頻率響應

陣列麥克風間距、音效頻寬、和取樣率之間的關係,值得我們進一步探討。寬頻HD-語音採用16 kHz的取樣率,這對語音傳輸而言是理想的選擇。現有16 kHz寬頻取樣率與先前世代狹頻系統採用的8kHz,兩者在語音品質與言語可理解度(speech intelligibility)方面存在極大的差異。在語音辨識廠商的推動下,市場對更高取樣率的需求持續攀升,像是24kHz或32kHz。而像是語音頻帶應用,採用的取樣率規格就達到48 kHz,通常作為主系統音效取樣率。這麼做的動機是避免內部取樣率轉換。然而支援這些高取樣率所需額外的運算資源,卻抵不過有形的音效利益,因此16 kHz或24 kHz目前被廣泛接納為大多數語音頻帶應用的建議取樣率。

對於波束成型應用而言,高取樣率很容易衍生問題,因為當頻率等於聲音速度除以兩倍麥克風間距時,在這個頻率上就會出現空間映頻混擾(spatial aliasing)。空間映頻混擾讓人避之不及,因為在這樣的混擾頻率上無法進行波束成型。如果麥克風間距限制在21mm以下,即可利用寬頻系統(16kHz取樣率)來避免空間映頻混擾。較高的取樣率,需要用來防止空間映頻混擾所需的間距也越小。然而,我們不希望看到麥克風整體間距也跟著縮小,因為還會衍生出其他問題,像是麥克風公差以及麥克風感測器的本徵(非音響)雜訊。如果間距相當小,而本徵雜訊以及麥克風之間的靈敏度偏差衍生出各種干擾,其強度可能會蓋過麥克風之間的訊號差,陣列中各麥克風之間的訊號差異就會遞減(marginal)。在實務上,麥克風間距應不小於10 mm。

A2B 技術介紹

A2B 技術的研發目標是為了簡化新型車載麥克風與各種感測器密集應用的連結。從實作的角度來看,A2B是一種單主控/多子節點(最多到10個)的線路拓撲。目前量產的第三代A2B收發器包含五個系列成員 – 涵蓋汽車、工業、以及消費級工作溫度範圍。全功能 AD2428W,加上四個功能降階、成本較低的衍生版本—AD2429WAD2427WAD2426W、以及 AD2420W—構成ADI最新系列針腳相容的增強版A2B收發器產品線。

AD2427W 與AD2426W提供精減(僅限子節點)功能,主要鎖定麥克風連結應用,諸如免持聽筒、ANC/RNC、或ICC等應用。AD2429W與AD2420W屬於入門級 A2B 產品,相較於全功能版本具備顯著的成本優勢,尤其適合對成本敏感的應用,像是汽車eCall緊急呼叫,以及多元素麥克風陣列。表1顯示第三代A2B收發器的功能比較。

表1. A2B 收發器功能比較
功能 AD2420/ AD2420W AD2426/ AD2426W AD2427/ AD2427W AD2428/ AD2428W AD2429/ AD2429W
主控(Main Capable) 不支援 不支援 不支援 支援 支援
可發現子節點數量 最多10個 最多2個
功能性TRX模塊 僅A 僅A A + B A + B 僅B
I2S/TDM 支援能力
PDM 麥克風輸入 2個麥克風 4個麥克風 4個麥克風 4個麥克風 4個麥克風
節點間線路長度上限 5公尺 15公尺 15公尺 15公尺 5公尺

AD242x 系列支援菊鏈拓撲,由一個主控連結最多10個子節點,整體匯流排長度可到40公尺,各節點之間最遠可達15公尺。A2B的菊鏈線路拓撲是勝過現有環狀拓撲的一大優點,因為涉及整體系統完整性以及強固性。如果連到A2B菊鏈的一個節點發生故障,整個網路不會完全停擺。只有在失效點下游的節點才會受到影響。A2B內嵌的診斷機制除了會隔離失效源頭,還會發出岔斷訊號啟動修正程序。A2B的主控/子節點線路拓撲較現有數位匯流排架構更具效率。在經過簡單的匯流排發現程序後,就不需動用處理器去管理匯流排運行程序。A2B獨特架構另一項額外優點,就是系統延遲完全確定(2匯流排週期延遲,低於50微秒),不會受到A2B匯流排上音效節點的位置所影響。這項特點對於ANC/RNC 以及ICC這類語音與音效應用非常重要,因為從多個遠端感測器傳來的音效取樣訊號必須依時序排列(time-aligned)進行處理。

所有A2B收發器透過一條雙線式無遮蔽雙絞線傳送音效/控制/時脈等訊號、以及供電。這種模式能降低整體系統成本,原因包括

  • 實體線路數量比傳統建置方案更少
  • 纜線可採用成本更低、重量更輕的無遮蔽雙絞線,對比較為昂貴的遮蔽纜線。
  • 跳線(Jumper wires),在一些使用情境中,A2B 技術提供的匯流排供電功能,可以為A2B菊鏈上的音效節點提供最多300 mA電流供電。這種匯流排供電功能可取代ECU提供本地端電源 – 進一步降低整體系統成本。

A2B技術提供共50 Mbps的匯流排頻寬,能支援最多32個上游(upstream)以及最多32下游(downstream)音效通道,採用標準音效取樣率(44.1 kHz、48kHz等)與通道寬度(16、24位元)。這樣的設計為種類眾多的音效I/O裝置提供顯著的彈性與連結功能。各音效ECU之間維持完全數位的音效訊號鏈可確保全程保持最高的音質,排除在ADC/DAC轉換過程導致音質減損的狀況。

系統層級診斷是A2B技術的一個關鍵元素。所有A2B節點都能辨識多種故障狀況,包括開路、全短路(shorted together)、反接(reversed wires)、或是對地短路與對電源短路。這項功能對於系統完整性至關重要,因為在開路、短路、或反接等故障,在故障點上游處的A2B節點仍然完全正常運行。此外,診斷功能還針對系統層級故障提供高效率的隔離,這點對經銷商/安裝廠商而言至關重要。

最近發表的第四代A2B收發器AD243x在現有的技術基礎增加多項關鍵功能參數(節點數量增加到17個,匯流排供電提高到50瓦),另外還增加SPI式控制通道(10 Mbps),提供高效率的無線網路軟體更新(SOTA)功能,從遠端對智慧A2B連網節點進行程式化。AD243x系列元件提供的新功能讓它適合用在豪華型麥克風架構中配有LED燈的節點。

A2B麥克風與感測器在汽車產業的應用

從單一語音麥克風到HF通訊採用的多元素波束成型麥克風陣列,從ANC到RNC,從ICC到警笛聲偵測,麥克風在汽車產業發掘越來越多的應用。為迎合技術與市場趨勢,幾乎每款上路的新車都配備了至少一個麥克風模組來支援HF通訊。高階與豪華車款甚至會配備6個或更多麥克風模組,藉以實現波束成型、AEC、ANC、RNC、ICC等技術的潛力,在這些領域中數位MEMS麥克風具有顯著的優勢。

增加的麥克風數量對汽車資訊娛樂工程師形成一大挑戰-如何簡化連結纜線以及降低其重量。對於傳統類比系統而言這不是件簡單的工作。類比麥克風至少需要一組遮蔽雙絞線(接地與訊號/供電)、針腳、以及連接器端子等元件進行互連。線路的數量永遠是系統中麥克風數量的兩倍。此外,纜線總重量的增加速度甚至更快,總重量取決於連結每個麥克風模組所需的纜線長度。紓解這項問題其中一種簡單方法就是讓多種應用共用麥克風訊號,藉此減少系統中麥克風數量。舉例來說,相同的麥克風訊號除了用在HF通訊,還能同時作為ANC系統的錯誤訊號。此外,不同應用可能需要不同的麥克風特性。在先前提到的例子中,HF麥克風訊號通常偏好上升的頻率響應波形(靈敏度隨著下降頻率而降低),藉以消除車廂中低頻雜訊內容。對於提升語音麥克風語言可辨識性方面,這是相當實用且有效率的技巧。反觀ANC麥克風則必須在低頻率處有夠高的靈敏度,因為ANC演算法的主要目的就是降低低頻雜訊。因此,為讓類比系統中的兩種應用能共用麥克風,來自麥克風的訊號在饋送到不同電路之前必須進行適當的頻率濾波。在這種情況下,可能會形成一個或多個接地迴路,從而產生嚴重的雜訊問題。

作為一種支援菊鏈的數位匯流排,結合數位MEMS麥克風的A2B技術提供一種極為匹配的解決方案,用來連結與/或共用多個麥克風訊號,提供給音效、消噪、以及汽車環境中快速增加的其他聲波應用。舉一個想像情境為例,汽車通話用到HF麥克風模組、ANC麥克風模組、以及一個簡單的陣列麥克風模組,包含兩個波束成型用的麥克風元件,這三個模組都整合在駕駛座上方天蓬處。圖3a與3b顯示如何運用傳統類比與數位A2B系統實現此類設計。

Figure 3. (a) Analog system design with analog mic elements (shielded wires). (b) Digital system design with digital mic elements (A<sup>2</sup>B technology and UTP wires).
圖3. (a) 包含類比麥克風元件(遮蔽纜線)的類比系統設計 (b) 包含數位麥克風元件(A2B技術與無遮蔽雙絞線)的數位系統設計

由於類比系統無法簡單接納麥克風共用的模式,每個應用模塊(HF、ANC、以及波束成型)都需要專屬的麥克風以及獨立的接線來連結各個功能電路。這導致會有4個麥克風元件以及三組接線(總共7組接線與屏蔽線材)。反觀另一方面,由於數位A2B系統能輕易共用訊號,因此麥克風元件的數量就能減至4到2個。在這個例子中,一個微型電話模組包含2個高頻寬全向性麥克風元件,可用來提供兩個聲波訊號通道,覆蓋所有應用模塊的需求。當這兩個訊號通道透過簡單的無遮蔽雙絞線傳抵中央處理單元(像是車用音響或放大器),這些訊號就可進行共用,並以數位格式進行處理,藉以支援HF、ANC、以及波束成型等應用。

雖然圖3顯示的例子反應的不是真實狀況,但它明確展示A2B超越傳統類比技術的優點。像A2B這樣的數位音效匯流排系統能因應車廠面臨的挑戰,提供全新的音效與聲波相關概念,協助提升使用者經驗,並讓這些概念能推入市場,迅速導入實際商品。

的確,許多應用對於汽車市場過於新穎,或是在過去難以實作,無法運用A2B技術推動商業化。舉例而言,作為汽車音效解決方案的領導供應商,Harman International開發出一系列數位麥克風與感測器模組,其利用了A2B系統開發各種汽車應用。圖4顯示一些常見的汽車A2B麥克風與感測器,以及它們如何運用於汽車環境中。這些感測器包括單一A2B麥克風以及多元件麥克風陣列,用在ANC與語音通訊領域; 用在RNC的A2B加速計; 安裝在外掛保險桿上的A2B麥克風; 以及裝在汽車頂蓬的A2B麥克風陣列,用來偵測急救車輛警笛以及環境聲波監控。在這些A2B麥克風與加速計的促成下,業界著手開發越來越多需要多個感測器輸入的應用解決方案,協助汽車產業進一步提升使用者經驗。

總結

未來的汽車架構將更加依賴高效能聲波感測技術,例如麥克風與加速計。完整的數位方案包含感測器、互連、以及處理器,藉以提供顯著的效能與系統成本優勢。Analog Devices與Harman International著手提供具成本效益的解決方案,將為其終端客戶創造價值與差異化優勢。

Figure 4. Common A<sup>2</sup>B microphones and sensors.
圖4. 常見A2B麥克風與感測器