开放式音频:面向AR/VR应用的增强型高质量解决方案

2024-04-01

Figure 1

   

摘要

随着AR和VR的普及率不断提高,设计人员开始寻求将开放式音频技术作为一种新的声音播放解决方案。本文将讨论这种新颖外形设计的应用场景和优势及相关挑战,并重点介绍可为此类产品增强音频性能的技术。

引言

如今,耳塞和头戴式耳机已融入我们生活的方方面面。人们在走路、跑步、工作和接电话时,都可能会佩戴它们。虽然耳塞和头戴式耳机为聆听音乐、播客、有声书和接打电话提供了便利,但隔绝周围环境的声音也可能带来问题,例如无法听到驶近的车辆或他人的呼唤。为解决这方面的问题,再加上对增强现实(AR)和虚拟现实(VR)眼镜的需求不断增长,开放式音频技术越来越受欢迎。

Figure 1. Smart glasses with speakers embedded in arms.

图1. 眼镜腿中嵌入扬声器的智能眼镜。

什么是开放式音频?

开放式音频设备通常是指不会挡住或遮住耳朵的个人音频播放产品。这些设备允许外界噪声穿过,使用户能够听到周围环境的声音,保持对环境的感知。智能太阳镜、配镜眼镜及各种AR和VR头戴设备已采用这种技术。在典型的应用中,微型扬声器 安装在眼镜腿或VR头戴设备上,声音从上方直接传导到耳朵。

开放式聆听有许多优势。例如,骑自行车时可以听到周围交通工具的声音,从而降低事故发生风险。此外,长时间使用耳塞或头戴式耳机会感到闷热或耳朵疼痛,开放式聆听技术能够消除这种不适感,防止身体疲劳。如果设计得当,开放式音频设 备既能为用户提供出色的音质,又能有效控制声音外泄,减少对周围人的干扰。此外,与人交流时,无需摘下头戴式耳机或耳塞,让沟通更加流畅自然。接听电话也变得更加自然,因为耳朵未被遮挡,用户能够同时清晰听到外部声音和自己的讲话。传统的耳塞和头戴式耳机依赖麦克风将用户的声音通过扬声器传回(有时称为侧音),以便用户可以听到并调整自己的声音,避免听起来不自然或太小声。试着用手指堵住耳朵说话,你会发现很难听清自己的声音,而且声音变得非常低沉模糊。即使是一些优秀的耳塞设计,也很难解决这一问题。然而,开放式设备没有这种困扰,因为它不会堵塞耳朵。

开放式音频的应用在三个关键应用场景中显著增加:VR头戴设备、增强现实/混合现实(AR/MR)眼镜、音频/视频眼镜(图2)。在VR领域,许多制造商已采用开放式解决方案来减小头戴式显示器(HMD)的尺寸、重量和复杂性。这样集成后,便无需外部头戴式耳机。苹果公司最新发布的Vision Pro配备复杂的开放式音频系统、空间音频集成和3D耳朵映射,展现了这一领域的进步。现在,VR头戴设备能够使用摄像头观察外面的世界,因此听到周围环境声音的能力变得至关重要;我们可以预见,开放式音频将成为常用的解决方案(图3)。

就AR眼镜而言,开放式音频是整体体验的重要组成部分。如果没有音效,光有视觉效果的沉浸式混合现实体验就不完整。通过利用头部追踪功能进一步改善空间音频,沉浸式体验的可信度将得以提升。此外,在企业和工业应用场景中,对音频有特 定的要求,因为这些应用场景通常处于嘈杂且声学条件苛刻的环境中,比如工厂车间或汽车修理厂。在这些环境中,保持对环境的感知同时清晰传达信息至关重要。

在不久的将来,带有嵌入式麦克风和扬声器的眼镜将成为常见的应用场景。通过这种外形设计,用户能够快速访问语音助手、无缝接打电话和播放音乐。如果具备视频录制功能的眼镜逐渐普及,开放式音频播放也将随之成为标配功能。不难想象,音频眼镜在未来将无处不在,可能接下来十年内就会成为主流。

Figure 2. Future smart glasses will integrate many visual and audio features.

图2. 未来的智能眼镜将集成许多视觉和音频功能。

开放式音频技术具有诸多优势,但也带来了一些难题。头戴式设备需要重量轻,并提供持久续航,以便长时间使用。在音频信号路径中,效率变得至关重要,尤其是当加入视频录制或视觉显示等耗电量大的功能时。此外,这些设备在公开场合佩戴 时需要具备时尚感和吸引力,应当能够便捷地进行充电,尤其是对于配镜眼镜。此外,由于耳塞在音频性能方面设定了高标准,因此消费者期待同样高水平的音质体验。

开放式音频设备所面临的声学难题显而易见,但解决起来并非易事。由于其扬声器不像头戴式耳机或耳塞那样是封闭的,有时可能离耳朵较远,因此在自由空间里可能会损失低频能量。此外,它们比典型的头戴式耳机放大器需要更多的功率,因此需要使用不同的音频放大器系列。工业设计方面的考量也非常重要,因为如果将扬声器放置得较远,周围人将更容易听到声音。

Figure 3. Better audio can make a difference in immersive VR experiences.

图3. 更高质量的音频能够大幅提升沉浸式VR体验的效果。

ADI公司提供一系列具有适当规格和特性的音频放大器,可满足上述许多需求。此外,ADI为开放式音频提供系统解决方案,包括语音算法1、电池管理、充电产品2 ,从而有效应对上述难题。为了充分提高音频性能,必须在紧凑的封装中使用具有出色效率和高功率的扬声器放大器。实现电流和电压(IV)反馈(即跟踪经过扬声器的电压和电流)是优化小型扬声器性能的另一种方法。获得专利的ADI扬声器保护算法可利用扬声器IV数据来进一步增强系统中使用的微型扬声器的性能。

两种方法:数字即插即用放大器和智能放大器

MAX98361是ADI提供的一款即插即用型D类放大器,可帮助产品设 计人员快速创建高质量音频解决方案,无需进行I2C编程。这款产品兼具模拟放大器的简单性与数字输入放大器的性能和效率。在智能眼镜项目中,如果音频设计不是主要关注点,这款放大器将是理想之选,所需的专业知识极少,使用门槛低。此外,这款产品本身支持多通道TDM音频,可在每侧放置多个扬声器3,以获得更多控制和沉浸感。

其他解决方案包括智能D类和D/G类放大器。这些放大器利用片 内IV反馈ADC来准确判定微型扬声器的热量和振幅限值。有了这 些信息,便可安全地让扬声器在超过额定参数的情况下运行, 而不会造成损坏。ADI还提供一套算法,统称为 Dynamic Speaker Management™ (DSM)解决方案,可根据IV数据优化扬声器性能。DSM已集成到各种常用SoC中。

MAX98390是其中一款放大器,具有内置数字信号处理器,可将这些算法直接集成到放大器本身,减少了主机处理器上的MIPS负载。这款放大器可使用具有直观界面的配套软件DSM Sound Studio进行编程,从而实现快速调校,并带来显著的提升效果。

根据应用,MAX98390可将低频下潜深度增加多达两个八度,并实 现2.5倍响度(图4)。此外,这款放大器具有出色的功耗表现4 , 满足升压型D/G类放大器的要求。而且,它具有感知功率降低 (PPR)特性,可在不影响音频保真度的情况下,将效率进一步提 高25%。MAX98390为系统设计提供了灵活性,配备带有包络跟踪 功能的可编程升压转换器,以达到理想效率。

Figure 4. Illustration of improvements to frequency response and loudness using DSM.

图4. 使用DSM改进频率响应和响度的示意图。

ADI最近还推出了 MAX98388,这是一款专为AR/VR和智能眼镜应用设计的新型D类放大器。这款放大器集成了IV反馈以实现智能放大器特性,且效率高达90%。

结论

无论您是要开发集成扬声器的眼镜,为客户提供出色的音频体验,还是设计要在嘈杂环境中大音量播放的工业混合现实眼镜,市面上正涌现越来越多经过优化的解决方案,能够满足您的需求。要想在小尺寸设计中最大限度提高性能,具有IV反馈和扬声器管理算法的智能音频放大器是理想的选择。其他新兴技术,比如并行电池管理IC5、用于语音处理的低延迟音频数字信号处理器6等,也将帮助推动VR/AR和其他开放式音频形式的普及。这些新兴技术有助于增加运行时间并最大限度减少停机时间,使用户在遭遇中断后能够快速恢复聆听。音频技术的未来就在前方,耳之所听,心之所喜。

参考文献

适用于可听戴设备和可穿戴设备的音频解决方案”,ADI公司。

Kyle Johnson,“利用USB-C实现并联电池充电如何帮助提升用户体验”,ADI公司,2023年8月。

通过近场环绕声提升增强/虚拟现实体验”,ADI公司,2021年6月。

动态扬声器管理”,ADI公司,2019年。

MAX17332,ADI公司。

ADAU1860,ADI公司。

关于作者

Ryan Boyle
Ryan拥有马萨诸塞大学洛厄尔分校电气工程学位,辅修音频录制技术。在加入ADI公司之前,他在Bose Automotive Systems工作,从事产品营销和概念开发相关工作。他终身热衷于音频和音乐

最新视频 21

Subtitle
了解更多
添加至 myAnalog

将文章添加到 myAnalog 的资源部分、现有项目或新项目。

创建新项目