向右滑动:上一篇 向左滑动:下一篇 我知道了
广告

剖析Imagination的A-Series GPU新架构:和高通Adreno和Arm Mali比比

剖析Imagination的A-Series GPU新架构:和高通Adreno和Arm Mali比比

本月月初,Imagination Technologies在上海进行了一次宣称是“15年来最重要的GPU IP发布”。这次发布的GPU IP新品名为A-Series,没有沿用早前以数字为系列代号的传统,而且似乎还弱化了PowerVR在产品名中的存在……

lzvesmc

这枚小型处理器,还有一些特别的工作场景,比如说“如果GPU执行出现问题,我们可以通过固件记录有关GPU的信息,快速发现问题在哪里。控制获取信息,写回到内存,给予我们在GPU真实应用中debug的能力,而不是通过仿真去进行。这是分析问题非常出色的工具,如果应用在汽车系统中,还能进行错误分析。”lzvesmc

20191206-imagination-17.jpglzvesmc

除此之外,A-Series在架构层面还有一些比较重要的变化,体现在纹理单元上(Texturing Unit),相关于将图像放到屏幕上的。比如说L0 cache的位置发生了变化,新架构的位置是在处理与线性过滤阶段之间。原本Rogue架构中,包括纹理解压(texture decompression)、gamma、YUV转换等操作都是在L0 cache之后进行的,这样一来某些相同的任务会被多次重复执行处理。而L0 cache位置调整后,可储存处理阶段时候的输出,数据可复用——多项异性过滤的时候,texel不需要再重复采样。lzvesmc

还有针对一些陈年旧算法的改进,比如说各项异性过滤(anisotropic filtering)以前一直是基于DirectX的——早年Imagination有参与过桌面GPU市场混战,当时这项特性自然是紧跟微软的参考算法的。所以这次“我们彻底重构了纹理采样方式”,“现在更加不依赖于角度(more angel-independent),采样更少但实际(各项异性过滤)质量更高。”这种算法的提升,实质也是减少带宽、增加能效的重要方案。”lzvesmc

此外,Rogue架构在合并(blending)操作上用的是shader。更早之前这种操作会有个专用单元去执行,Beets说Rogue采用软件的方式来执行合并操作虽然具备了很大弹性,而且节省空间,但这样一来系统会复杂化。“由于合并操作(shading a blending)越来越复杂,我们还是需要额外的指令来更高效地执行合并操作,所以A-Series又回归了专用合并单元。这样可以释放shader周期,减少数据搬运量。”lzvesmc

20191206-imagination-18.jpglzvesmc

最后值得一提的是AI Synergy,实际也是本次Imagination技术发布的重点,不过它的实质是让A-Series GPU与Imagination的神经网络专核NX NNA产品做协同的,在GPU和AI专核之间实现AI负载的共享——GPU可以负责模型更多可编程层面的工作,NNA则针对全连接层处理的固定单元做任务处理。这部分不是我们针对图形计算要探讨的重点。lzvesmc

搭建生态是当务之急

实际上,还有一些特性是Imagination并没有着墨于A-Series的,比如当代GPU比较常见提升带宽效率的framebuffer图像压缩技术。Imagination的压缩方案名为PVRICv4,不过这套方案的最新版本实际已经在Series 9产品中得以应用。针对有损与无损压缩有单独的管线。Beets这次说Imagination持续加强了其HDR压缩率。lzvesmc

就这些技术来看,的确可以认为是Imagination近15年来“最重要的发布”,它已经充分凸显了Imagination做策略转变的决心,而且至少就Imagination自己的纸面数据来看,在能力上是优于竞争对手的。不过这并不能表明Imagination未来就可以在GPU市场上轻易获胜。lzvesmc

开发者生态此时变得极其重要,究竟有多少客户会采用A-Series GPU IP?这和生态的成熟度、市场价值有很大关联。lzvesmc

针对开发者软件部分,Imagination也下了一番功夫,包括跨操作系统,对各种行业标准API的支持,对各种游戏引擎的完整支持。lzvesmc

20191206-imagination-19.jpglzvesmc

面向开发者的有一项特性值得一提,即如上图所示,Imagination为开发者构建了“heatmap”:“很多开发者都在苦苦进行性能优化,尤其是图形计算方面。或许性能计数器(performance counter)会告诉你ALU限制、纹理限制,但对你的帮助其实真的不大,所以我们增加了一个新特性,生成图形计算画面的热图(heatmap),它会告诉你GPU在屏幕上的某个tile上面花了多长时间做渲染。我们的工具要做到这一点很容易。开发者能够很方便地搞清楚某些tile的渲染开销很大,花了最多的shader周期、最多的带宽等等,这样一来就能真正帮助开发者获得性能上的优化。”这其中的实现似乎与硬件上的固件处理器也有关系。

原创
本文为国际电子商情原创文章,未经授权禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
黄烨锋
欧阳洋葱,编辑、上海记者,专注成像、移动与半导体,热爱理论技术研究。
  • 微信扫一扫,一键转发

  • 关注“国际电子商情” 微信公众号

  • 穿戴设备强化健康监测功能,带动光电二极管需求成倍增长

    随着强化健康检测性能的需求增温,相关零组件市场仍维持强劲动能。例如为了提升感测数据的准确度,穿戴设备厂商会使用更多的绿光LED与红外线LED...

  • 对付华为?英国立法收紧外资收购限制

    国际电子商情从外媒获悉,由于担心“高风险供应商”华为在英国的商业投入和高校合作学术研究有可能带来“国家安全风险”,英国首相Boris Johnson正准备颁布新法,加强对外资收购英国企业的限制,防止有可能带来“国家安全风险”的外资收购行为...

  • 市场呼求第二代额温枪方案:40度高温下精度仍能达到±0.

    这场在全球持续数月的疫情,仍未有消停的迹象。中国作为首先“摘下口罩”的国家,自然成为了满足海外 防疫物资的中坚力量。然而,一些被政府纳为中国合格制造商“白名单”的额温枪生产商,产品为什么会被海内外客户退回?

  • 2020年1-5月集成电路进口2011.5亿个,增加27.3%

    海关总署最新统计数据显示:今年1-5月,我国货物贸易进出口总值为11.54万亿元人民币,比去年同期(下同)下降4.9%。其中,今年前5个月,进口集成电路2011.5亿个,同比增加27.3%,总价值为8794.3亿元人民币,同比增长14.5%。

  • 疫情影响,预计Q2整体IC市场销售额季减5%

    市调机构IC Insights昨(4)日公布了一份21家半导体公司在2020年二季度的销售业绩指引清单。该清单罗列的公司来自全球各个地区和国家,包含所有半导体种类。该机构预测,2020年第二季度整体IC市场将比2020年第一季度下降6%...

  • A股IPO前5月扎堆过会,科创板上市超四成!(附表)

    有人用“魔幻现实主义”来形容今年的表现,一方面普通群众开始摆起地摊,另一方面更多企业法人走上前往交易所敲钟的道路。 值得注意的是,疫情期间,A股IPO数量似乎并未受到太大的影响。据《国际电子商情》统计,今年已经有124家企业A股IPO过会,其中科创板上市企业超过四成……

近期热点

广告
广告

EE直播间

更多>>

在线研讨会

更多>>