向右滑动:上一篇 向左滑动:下一篇 我知道了
广告

比一比摄像头和视觉,麦克风和听觉厂商备战智能汽车

麦克风也能扮演像摄像头般重要的角色,能为自动驾驶汽车增添更多智能功能吗?

DSP Concepts执行长与创办人Paul Beckmann表示,在汽车和驾驶人发现救护车接近以前,就已经听到它的警报声响起了。那么为什么汽车产业不会对音频感兴趣?

系统OEM厂商(不只是汽车制造商)目前正处于“使用更多麦克风以便为人工智能(AI)产生另一种重要传感器数据——音频”的关键时刻,Beckmann解释。

正如他所默认的,音频正“从单纯的在娱乐系统中播放,朝向在情境架构中实现输入、触发与分析。”

由麦克风所拾取的智能,也可能用于日常生活的各种系统中,从汽车、数字虚拟助理到便携设备等。“视觉与听觉应该并驾齐驱,”DSP Concepts业务与营销执行总裁Willard Tu表示。“狗吠声、婴儿哭闹、玻璃碎裂、汽车喇叭、警报声与枪声等等……音频有助于让系统更有效地掌握环境和情境。”
20160905-Audio-1
图1:音频“输入”算法发展蓝图 (来源:DSP Concepts)

如今,有两个重要的发展趋势推动电子产业突然在音频领域迅速发展。

一是拥有多颗麦克风的智能手机普及;其次则是数字虚拟助理的流行,如Amazon Echo与Google Home。根据SAR Insight & Consulting总监与首席分析师Peter Cooney的观察,“一般消费设备中整合虚拟数字助理的应用越来越多,带动感知与采用语音作为自然的用户接口,应用于许多日常任务中。”

但是,麦克风能多快超越作为一种自然用户接口的角色,开始变成真正的‘智能传感器’?看来业界还得等待一些进展。

为了迎接挑战,音频需要可以拾取更佳音质的麦克风、善于后处于音频的处理器、预处理音频的有效算法、易于使用的音频处理工具、相当于绘图用Open GL的音频标准,以及能以最小功耗维持永不断线的麦克风。

总之,如同Cooney所指出的,市场需要“始终保持监听的技术、语音增强算法以及麦克风。”

在ARM处理器上实现音频处理

音频处理以往是播放系统(如TV、DVD和Hi-Fi音响系统中的均衡器)才需要的专业领域。

而今在智能手机和其他家用设备的麦克风普及带动下,音频处理任务已经扩展到几乎无处不在。专用音频DSP也并不是系统中处理音频的唯一芯片了。

随着越来越多的音频开始在ARM处理器上执行,Beckmann指出,更多的OEM“热切地将麦克风视为”AI的输入传感器。DSP Concepts正处于观察这一市场过渡的最佳位置。

Beckmann看好市场成长的态势,特别是因为该公司一款称为Audio Weaver在过去一年来的成果。如同Beckmann描述的,这是“唯一一款可跨平台作业的绘图音频设计架构。”

业界分析家认为,DSP Concepts正占据音频市场上的独特位置。TECHnalysis Research总裁兼首席分析师Bob O'Donnell认为:“我并未看到DSP Concepts或其Audio Weave工具面对哪几家竞争对手。许多公司都针对音乐与录音等目的进行专业的音频剪辑与音频处理,但这毕竟是不同的领域。”

库尼表示同意。“我不知道任何竞争产品音频织女的。”他补充说,“DSP概念有其他的产品也是如此,如声音增强算法(噪音抑制,回声取消,波束赋形),基准和参考设计。”

Cooney也同意这一看法。“我还不知道Audio Weaver有任何竞对手。”他补充说,“DSP Concepts也有其他的产品,例如声音增强算法(噪声抑制、回音消除、波木成形等)、基准与参考设计。”
20160905-Audio-2
图2:全球麦克风与音频处理器市场 (来源:SAR Insights & Consulting)

DSP Concepts并未设计或销售DSP。然而,竞争对手一般都是其他的DSP业者。Audio Weaver的竞争产品来自德州仪器(TI)或Cirrus Logic等DSP供货商自行打造的音频工具。其差异之处在于那些内部开发的工具仅用于DSP供货商自家的芯片。而采用像Audio Weaver这样的独立平台工具,Tu强调,“OEM不必被限制于一种特定的DSP。”

Cooney说,DSP Concepts藉由与Cadence/Tensilica等许多公司合作,主要的业务在于为其客户提供音频设计解决方案。

除 了Audio Weaver工具,DSP Concepts也授权一些可形成麦克风输入的音频算法,包括波束成形、回声消除、噪声消除与远音场(far-field sound)等算法。Beckmann指出,在此业界缺乏深谙音频处理的工程人才之际,市场亟需易于使用的音频预处理算法,以便能从不需要的环境噪声 中区隔出声音来。

音频:长期受冷落的领域

然而,目前使用音频进行声学事件检测(和分析)仍然是一种相对较新的应用。

O’Donnell指出,“理论上,可能会有更多专用音频处理器在做AI,但坦白说,音频就像是长期受到视频的冷落一样,而且时至今日也是如此。”

他补充说,声音的另一项重大挑战是语言与意义。他说,“一张树的图片以任何语言来说是树,但要了解字、词以及最重要的意义与意图,就具有语言与文化的独特性了。这使得语音识别与自然语言的处理变得十分困难。”Beckmann坦承,音频缺乏标准,也造成了差距。

以OpenGL来看,它是一种针对图形渲染的跨语言、跨平台API。对于想要编写程序代码的视讯游戏设计人员来说,这种API十分重要。像Nvidia等GPU供货商在使用这种API后就能优化其硬件。

音频世界则可以使用硬件抽象层来实现跨平台的硬件加速渲染,类似于OpenGL所扮演的角色一样。如果缺乏标准,每一家音频芯片公司都必须优化自家硬件以及自给自足。缺乏标准推迟了扩展跨平台的音频应用所需的创新脚步。

实现永不断电的续航力

Amazon Echo或Google Home等流行的数字虚拟助理下一步要实现的就是“长时倾听”(always-listening)的能力。Amazon正透过其‘tap-then-speak’的语音启动机制加速这方面的进展。但该设备还不能称得上是‘always listening’。
20160905-Audio-3
图3:全球语音接口与长时倾听技术市场 (来源:SAR Insights & Consulting)

具有永不断线/长时倾听能力的设备一旦走出家门,将开始面临各种挑战。到了户外,它的音频处理能力必须从背景噪声中区隔出需要听到的声音。此外,Beckmann强调,更大的问题还在于电池寿命。

为此,他指出,“位于波士顿的新创公司Vesper开发的静态感测MEMS组件就十分关键。”Vesper专门开发压电MEMS麦克风,不久前还发布了一款新的声学传感器,可利用声能唤醒完全待机中的系统。

Vesper 执行长Matt Crowley表示,这款新的压电MEMS麦克风VM1010可在倾听模式下汲取仅3μA电流,该组件预计在今年第四季出样。Crowley并承 诺,VM1010的新版本将会配备‘鉴频’(frequency discrimination)功能。这表示系统设计者可因应枪声、玻璃粉碎或人声等特定的噪声特性编程MEMS麦克风。

汽车内部

回过头来看看汽车内部的音频应用。语音为汽车内部提供了自然的人机接口(HMI)。

为了提高驾驶人使用免持听筒的语音质量,一线厂商与汽车OEM严重地依赖音频处理技术。Beckmann说,“配备多声道(从8-32声道)扬声器的汽车,带来了十分复杂的音频系统。”

不仅如此,随着电动车的出现,汽车产业开始使用假引擎噪音——或“电子声音”。从BMW到福斯(Volkswagen)等越来越多的汽车制造商开始玩各种共鸣放大器技巧。

事实上,不只是电动车,当今更省油的引擎声音更安静,也较不那么有力了。汽车制造商担心所有的平静可能会让潜在买家却步。

对于汽车产业的许多人来说,音频是熟悉的领域。汽车制造商们知道,音频可以为其提供差异化。车内的声学传感器不仅可以听到外面发生的事情,未来车子自己的引擎也能够针对诊断应用侦测任何异常情况。
20160719-ESMC-1

Edit
本文为国际电子商情原创文章,未经授权禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
Junko Yoshida
ASPENCORE全球联席总编辑,首席国际特派记者。曾任把口记者(beat reporter)和EE Times主编的Junko Yoshida现在把更多时间用来报道全球电子行业,尤其关注中国。 她的关注重点一直是新兴技术和商业模式,新一代消费电子产品往往诞生于此。 她现在正在增加对中国半导体制造商的报道,撰写关于晶圆厂和无晶圆厂制造商的规划。 此外,她还为EE Times的Designlines栏目提供汽车、物联网和无线/网络服务相关内容。 自1990年以来,她一直在为EE Times提供内容。
  • 微信扫一扫,一键转发

  • 关注“国际电子商情” 微信公众号

您可能感兴趣的文章

相关推荐

可能感兴趣的话题