向右滑动:上一篇 向左滑动:下一篇 我知道了
广告

号称全球最强性能AI推理芯片,平头哥发布自研芯片含光800

9月25日,在2019云栖大会上,阿里云智能事业群总裁张建锋发布了MPU芯片含光800……

“我手里的这款芯片真的很大,性能非常好,”张建锋表示,含光800是全球最高性能AI智能芯片。这是阿里巴巴第一次用了自己的硬件架构,集成了阿里算法到芯片里面去,也是互联网公司研发的第一款大的芯片。

据悉,这款含光800 AI芯片,平头哥用最短的时间完成了芯片的设计、流片整个过程,7个月完成前端设计,之后用了3个月成功流片。

据介绍,含光800芯片在业界标准的ResNet-50测试中,推理性能达到78563 IPS,比目前业界最好的AI芯片性能高4倍;能效比500 IPS/W,是第二名的3.3倍,基于含光800,AI云服务正式在阿里云上线性价比提升100%。“一个含光800的算力相当于10个GPU。”张建锋说。

这款号称“球最强性能AI芯片”——含光800是一款侧重于推理的AI芯片。由于人工智能芯片的差异化设计主要体现在硬件架构和软件算法上,二者需要高度适配才能发挥芯片的最大价值。从目前来看,传统CPU、GPU在深度学习推理任务上并没有完全发挥硬件能力,例如GPU架构主要针对图像处理设计,其硬件结构、软件生态几乎固化,因此对AI任务很难有深度优化。

在算法方面,阿里巴巴达摩院机器智能实验室过去两年构建了完整的算法体系,涵盖语音智能、语言技术、机器视觉、决策智能等方向,并且取得多个世界领先水平的成果;硬件方面,阿里巴巴此前已在服务器、FPGA以及存储等领域拥有多年研发经验,此外,平头哥团队在体系结构、编译技术等领域拥有深厚的技术储备。

含光800性能的突破得益于软硬件的协同创新,芯片架构方面,含光800采用创新的架构,针对深度学习中使用的大量权重参数和张量数据,在支持稀疏压缩与量化处理的基础上,通过独特设计的数据访存与流水线处理技术,大大减低了I/O需求和数据的搬移。NPU同时深度优化了卷积,矩阵乘,向量计算和各种激活函数,通过高有效的硬件资源调度和全并行的数据流处理,把AI运算的性能和能效都推向极致。

目前,含光800已开始应用在阿里巴巴内部核心业务中。根据云栖大会的现场演示,在城市大脑中实时处理杭州主城区交通视频,需要40颗传统GPU,延时为300ms,使用含光800仅需4颗,延时降至150ms。拍立淘商品库每天新增10亿商品图片,使用传统GPU算力识别需要1小时,使用含光800后可缩减至5分钟。

此外,含光800将通过阿里云对外输出AI算力。张剑锋宣布,基于含光800的AI云服务从9月25日起正式上线,而且相比传统GPU算力,起性价比将会有100%的提升。

阿里巴巴集团在芯片领域短短三年,可以说是“顺风顺水”。在2017年的阿里云栖大会上,阿里达摩院正式成立;2018年的云栖大会上,平头哥半导体公司正式成立。在今年的7月和8月,平头哥先后发布高性能RICSC-V架构处理器玄铁910、无剑SoC平台,随着含光800的发布,平头哥端云一体产品系列初步成型。

“传统公司能做到的和不能做到的,阿里都能做到,我们用硬件的能力,互联网的速度,花了1年半的时间,做出了这款芯片。”张建锋说,阿里巴巴将成为软硬件一体化协同发展的公司”。

责任编辑:Elaine

本文为国际电子商情原创文章,未经授权禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
  • 微信扫一扫,一键转发

  • 关注“国际电子商情” 微信公众号

您可能感兴趣的文章

相关推荐

可能感兴趣的话题