向右滑动:上一篇 向左滑动:下一篇 我知道了
广告

拆解Amazon Echo:物联网不只有眼前的语音识别

Amazon Echo可说是目前最热销的物联网设备,伴随语音控制类智能硬件迅速崛起,语音的面纱也不再神秘……

无论你称它为智能麦克风、虚拟数字助理、家用机器人、语音控制或R2-D2,相较于Echo,最新的第二代Echo Dot的价格从89.99美元调整为49.99美元,并将于本月在美国上市销售。sABesmc

Amazon Echo(及其随后推出的Dot)开辟了一个新的市场,让装置供货商能够在语音撷取、提高麦克风音频分辨率、更先进的背景噪声过滤、更好的音场侦测与稳定联机能力等方面展开竞争,以提供更佳音频质量。
20161109-echo-1
Amazon Echo (左)及其第二代产品DotsABesmc

而像XMOS等公司虽然自家芯片并未用于Echo中,但也瞄准了这个新的语音接口市场。XMOS营销与业务发展副总裁Paul Neil表示,“物联网目前正是一场快速移动的盛宴。为了控制IoT装置,语音是最自然的用户接口。”sABesmc

Neil说,由于融合了“传统的微控制器(MCU)性能、嵌入式DSP以及灵活的I/O组合,使得我们的技术成为语音接口的理想选择。”sABesmc

然而,硬件装置之间的战争只是构成整个智能麦克风/扬声器市场的一部份。IHS Markit连网家庭资深分析师Paul Erickson强调,“真正的竞争变量来自云端。”sABesmc

为了追求更聪明的智能麦克风(能够处理复杂的查询和随机问题),云端服务领域的竞争越来越激烈。 Google预计将于今年年底推出Google Home与Google Assistant (Google Now的新版本),并藉此进入这个市场。Erickson表示,“而且市场上盛传苹果(Apple)很可能将在2017年挟其Siri进入这个领域。”sABesmc

Amazon Echo——这款IoT装置如此热门的另一个原因在于它极具潜力,可实现IoT的重要优点:经得起时间考验(Future-proofing)。sABesmc

芯科科技(Silicon Labs)软件副总裁Skip Ashton解释,Future-proofing的意思是确保装置可随时间进展持续添加更多功能特性。例如,Alexa为Echo提供的语音服务功能一开始有70种,如今已经增加到超过1,700种了。sABesmc

Echo可以回答问题、阅读新闻、为运动评分、控制灯光、从Amazon网站订购产品以及设定闹铃等。用户还可以利用该装置向Uber叫车或订购披萨外送等。sABesmc

“目前Echo大约每两周透过云端更新一次,”Ashton说,“Amazon会在星期五时发送电子邮件给Echo用户发布新功能, 」而Echo用户「也对于产品的功能持续增加怀抱着期待。”sABesmc

IHS Markit嵌入式处理器首席分析师Tom Hackenberg剖析Amazon Echo对于电子产业带来重大影响的原因:智能麦克风/智能扬声器应用对于处理器供货商来说极具价值。sABesmc

因为这种装置关键之处并不只是提供了本地智能。语音接口正普遍应用在广大的市场领域。不只是数字助理市场出现,成为智能手机App的消费电子装置版本,还有扬声器,也不是它唯一的外形应用。sABesmc

例如,他解释说,“家庭自动化中心和数字助理可以内建于电视、机顶盒(STB)、HVAC/环境控制中枢等等。此外,在车载信息娱乐方面也存在大量的应用,特别是着眼于其免手持的优点。”sABesmc

拆解Echo与Echo Dot

透过拆解Echo与Echo Dot并进一步比较后,Hackenberg说,“除了内存供货商,我发现Echo和Echo Dot的处理组件并没有明显的不同。”
20161109-echo-2
拆解Echo与Echo Dot (来源:iFixit)sABesmc

根据iFixit所进行的拆解,Amazon Echo采用:
•三星(Samsung) K4X2G323PD-8GD8 256MB LPDDR1 RAM (挥发性内存)
•SanDisk SDIN7DP2-4G 4GB iNAND Ultra Flash (非挥发性储存)
而到了新版的Dot则改用:
•美光(Micron) MT46H64M32LFBQ 256MB (16Meg x 32 x 4Banks) LPDDR SDRAM (挥发性内存)
•三星KLM4G1FEPD 4GB高性能eMMC NAND Flash (非挥发性储存)sABesmc

两款产品使用的处理器则是相同的。在Echo与Dot的核心采用的是德州仪器(Texas Instruments;TI)的媒体处理器DM3725,此外,高通(Qualcomm) Atheros QCA6234应用专用标准处理器则用于提供连接性。sABesmc

Hackenberg解释说,虽然内存可能稍微影响性能,但内存定价是波动的。因此,对于Echo系列的所有产品而言,在其整个生命周期中改变所使用的组件也很平常。sABesmc

相形之下,“联机模块,尤其是媒体处理器更加复杂,如果不是重大的产品更新,一般并不会改变,”他说。sABesmc

Hackenberg指出,Atheros处理器专用于作为连接应用标准产品。其设计是以Tensilica客制化XTensa核心为基础,而且它只做一件事——协调与网络的通讯,以利作业进行。sABesmc

Erickson补充说,“连接能力至关重要,因为它涉及哪些数据可被撷取、传送与接收云端数据的速度与可靠度等。由于速度/响应的可用性因素,它直接影响到与扬声器之间的互动有多么实时。因此,Wi-Fi的吞吐量、服务质量(QoS)与范围的改善,都将有所帮助。”sABesmc

所有的本地(local)智能功能是由TI DM3725进行处理。Hackenberg指出,“这是一款专为STB、TV、显示器、视讯游戏系统等各种多媒体应用而设计的系统单芯片(SoC)。”sABesmc

DM3725是一款以ARM Cortex A8为基础打造的组件,并整合TI的C64x+DSP与3D绘图加速引擎。“Cortex A8是一款成熟且经济型的应用处理器,但又完全足够用于本地执行简单的任务,”Hackenberg表示。sABesmc

然而,“如果应用变得复杂,而不只是一款扬声器这么单纯,可能就会有所变化。”
20161109-echo-3
Amazon Echo Dot主板 (来源:iFixit)sABesmc

整合DSP

根据Hackenberg,这颗SoC的关键就在于整合了DSP,甚至可能是GPU。sABesmc

“在一个典型的设计中,存在多个输入传感器(主要是麦克风)。整个音讯输入首先经DSP高度滤波,使系统快速地理解用户的语音和环境噪声之间的差异,”他说。sABesmc

“它甚至能够解读相对于该装置的位置或甚至发话者是谁;它还建立了一种模式,能够经过处理以匹配该模式(通常发送至云端),”他补充说。sABesmc

但是,GPU做什么呢?sABesmc

Hackenberg认为,对于本地智慧,GPU可以用于更简单、但快速且高效的本地模式匹配。
这可以让装置仍然响应所储存的控制模式,例如降低音量、切换频道或其他简单的控制,而无需网络连接,他解释说。接着,应用核心根据所需提供的响应、启动/关闭所需的输入或控制以及必须显示的内容等条件来执行应用程序。sABesmc

麦克风数组

Amazon Echo和Dot之所以吸引人之处在于它使用了7麦克风数组。Amazon声称,Echo和Dot由于使用了多支麦克风和波束成型技术,因而能在整个室内都听到你的声音——即使是正在播放音乐的环境下。该公司还表示,Echo是一款专业级的调音扬声器,能以360°沉浸式音效充满在整个房间中。sABesmc

根据IHS Markit负责MEMS和传感器的资深分析师Marwan Boustany表示,Echo采用了楼氏电子(Knowles)的MEMS麦克风。
20161109-echo-4
Dot采用7支麦克风数组sABesmc

Boustany指出,为声音频率提升其讯号噪声比(SNR)、匹配和性能,将有助于远场音讯撷取,同时改善语音识别。sABesmc

但最终,算法才是实现更优质语音识别的真正关键,他说,所谓的『智慧』就在于云端可能持续作为关键应用,而本地处理则可以提高对于简单/预定义词组(如Hey Siri等)的辨识能力。sABesmc

他以Cypheras为例表示,这一类的软件供货商将有利于智能家庭系统(如Alexa)中的语音识别功能。
20161109-echo-5Amazon Echo Dot (来源:iFixit)sABesmc

竞争日益加剧

以供货商来看,目前有几家提供微控制器(MCU)和连接用ASSP的供货商可能在此领域展开竞争,包括Apple、博通(Broadcom)、赛普拉斯(Cypress)、微芯科技(Microchip)、恩智浦(NXP)、瑞萨(Renesas)、意法半导体(STMicroelectronics)以及芯科科技(Silicon Labs)等。Boustany表示,」802.11n与BT 4.0的组合并不常见,但有些设计针对较低成本的解决方案或许将会只用蓝牙。sABesmc

媒体处理器较为棘手。虽然多家行动装置应用处理器供货商都可提供,但对于简单的应用来说成本太高。根据Hackenberg的观察,供货商们可能会选择不提供性能相当的DSP或模式匹配功能。sABesmc

“我可能会考虑采用Apple Ax、Broadcom BCM7xxxx、海思(Hisilicon) Hi3xxx、NXP i.MX、联发科MT8xxx、意法STiHxxx、高通(Qualcomm)Snapdragon等。当然,TI或许在成本方面具有最佳DSP支持(对于语音识别至关重要)的优势,但其他的这几家供货商也在不断地缩小差距中。”sABesmc

XMOS相信该公司将在这个市场上获得动能。对于诸如Echo这一类的语音助理产品,提高性能的关键在于远场语音撷取能力、波束成型与处理速度等。Neil认为,“凭借着大量的处理能力和嵌入式DSP,我们的XMOS单芯片组件提供了可扩展和差异化的解决方案。”
20161109-echo-6XMOS xCore语音接口案例 (来源:XMOS)sABesmc

20160719-ESMC-1sABesmc

Edit
本文为国际电子商情原创文章,未经授权禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
Junko Yoshida
ASPENCORE全球联席总编辑,首席国际特派记者。曾任把口记者(beat reporter)和EE Times主编的Junko Yoshida现在把更多时间用来报道全球电子行业,尤其关注中国。 她的关注重点一直是新兴技术和商业模式,新一代消费电子产品往往诞生于此。 她现在正在增加对中国半导体制造商的报道,撰写关于晶圆厂和无晶圆厂制造商的规划。 此外,她还为EE Times的Designlines栏目提供汽车、物联网和无线/网络服务相关内容。 自1990年以来,她一直在为EE Times提供内容。
  • 微信扫一扫,一键转发

  • 关注“国际电子商情” 微信公众号

您可能感兴趣的文章

相关推荐

可能感兴趣的话题