向右滑动:上一篇 向左滑动:下一篇 我知道了
广告

人工智能生成的声音可以欺骗你的耳朵

MIT开发出一款人工智能系统,该系统可“观看”无声视频并生成该视频应该包含的声音……

人工智能已经突破了一项声音障碍。麻省理工学院(MIT)的研究人员开发了一款人工智能系统,可以“观看”无声的视频并且生成一段声音,效果十分逼真,以至于多数观众无法分辨出这些声音是否是计算机生成的。Otyesmc

MIT计算机科学和人工智能实验室(MIT Computer Science and Artificial Intelligence Laboratory)称,其“深度学习算法”是头一个通过“声音图灵测试”的,生成的声音能够以假乱真。
20160616-AI-1
这款视觉指示声音系统(Visually Indicated Sounds,简称Vis)受到训练,能够对棍子击打、刮擦或者捅一系列物体(从树叶、水到土壤和钢铁)时发出的声音进行分析。Otyesmc

研究人员称,Vis的本领可以延伸至很多其他场景。例如,未来的版本可以为电影和电视生成比传统方法(比如在铝箔上撒盐以模拟雨声)更逼真的声音效果。Otyesmc

该项目的负责人安德鲁•欧文斯(Andrew Owens)称,更重要的应用或许是帮助机器人理解物体的物理属性、更好地与它们所在的环境互动。该项目将于本月晚些时候在拉斯维加斯举行的计算机视觉与模式识别大会(CVPR)上展出。Otyesmc

“机器人可以看着人行道、本能地知道水泥地是硬的而草地是软的,因此知道如果它踩上两种地面会发生什么,”他说,“能够预测声音,是预测与世界进行物理互动的后果的重要第一步。”Otyesmc

该MIT团队“训练”Vis的方法是,向其输入包含4.6万种声音的1000段视频,这些声音是鼓槌在不同坚实度的物体上敲打或划过而产生的。之后,帮计算机在大量数据中找到模式的“深度学习”算法对这些声音进行解构。Otyesmc

为了从无声视频片断中预测一种新声音,Vis会查看最可能与每个视频画面相关的音频属性,并把这些音频串在一起编辑成连贯的声音。Vis可以模拟快节奏和舒缓的微妙声音,无论是断断续续拍打岩石的声音,还是穿过常春藤时发出的细小沙沙声。它既可以模拟击打垫子发出的低沉砰砰声,又可以模拟敲击栏杆时发出的刺耳声音。Otyesmc

为了测试这些声音在人耳听起来的逼真性,研究人员对400名观众进行了调查。他们观看了两遍视频,其中一遍听的是真实声音,另一遍听的是Vis的模拟版。他们要说出哪一次是真实的声音。Otyesmc

如果Vis生成的声音与真实的声音无法区分,Vis版被选择的概率应为50%。结果调查得出的概率为40%,这是一个相当不错的分数。Otyesmc

当声音清晰、尖锐时——比如敲木头或金属的声音——该系统的表现最差,在生成由树叶或泥土产生的较轻柔、持续时间较长的声音时,Vis表现最好。有时,如果棍子刚好停在目标物之前,它还会“幻想出”假的敲击声。Otyesmc

欧文斯的梦想是在没有明确视觉线索的情况下让Vis模拟声音。“从微风轻抚、到笔记本电脑的嗡嗡作响,任何时候环境中都存在着许多与我们正盯着看的东西无关的声音,”他说。(来源/FT中文网)Otyesmc

20160613-ESMC-1Otyesmc

Edit
本文为国际电子商情原创文章,未经授权禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
  • 微信扫一扫,一键转发

  • 关注“国际电子商情” 微信公众号

您可能感兴趣的文章

  • 转型不易?传华为拟将云端业务一分为二...

    国际电子商情8日消息,日媒最新报道声称,一份华为近期发出内部文件显示,这家中国电信巨头计划解散仅成立了14个月的核心云端和人工智能(Cloud&AI BG)业务,考虑将相关人力和资源合并到其他业务部门...

  • 国产“芯”力量!30家AI芯片厂商调研报告

    Aspencore旗下《国际电子商情》姊妹媒体《电子工程专辑》分析师团队对中国本土的AI芯片设计公司进行了第一手调查和网络汇编整理,从众多AI芯片设计厂商中挑选30家,从核心技术、代表产品、典型应用场景等多个维度进行了分析。无论云端训练和推理、边缘计算还是终端AI,AI都需要高能效的算力支持,而AI芯片无疑是输送算力的硬件保障...

  • AI芯片:在魔幻的时代找到希望

    2020年之于AI芯片,是既魔幻,但又充满希望的一年。

  • 特朗普的“眼中钉”,智能空联网是什么?

    随着人工智能的兴起,航空亦将步入智能时代,然而由于航空是一种专业性极强且产业链又很长的小众产业,因此其智能化与其它产业相比显得有些迟缓拖沓...

  • “智能制造2025”进入倒计时,工业自动化仍叫好不叫座?

    比半个米粒还小的螺丝,拿几斤重的螺丝枪去吸,一晚上平均要打1300个,也就是反复抬手一千多次,几乎十多秒要重复一次相同的动作……如此耗人力、低效率的电子制造场景,时至2020年仍出现在国内规模数一数二的电子代工厂里。

  • 国际大厂角逐SiC MOSFET,力争乘上5G“东风”!

    如今随着5G技术日益普及,场景转换效率和高温稳定性的应用需求与日俱增,碳化硅(SiC)器件凭借其优异特性而加速渗透。其中SiC MOSFET作为碳化硅电力电子器件研究中最受关注的器件之一,已在5G基站、工业电源、光伏、充电桩、不间断电源系统以及能源储存等场景中的需求量提升,引来不少国际大厂的积极探索和深入布局……

相关推荐

可能感兴趣的话题