向右滑动:上一篇 向左滑动:下一篇 我知道了
广告

剖析Imagination的A-Series GPU新架构:和高通Adreno和Arm Mali比比

剖析Imagination的A-Series GPU新架构:和高通Adreno和Arm Mali比比

本月月初,Imagination Technologies在上海进行了一次宣称是“15年来最重要的GPU IP发布”。这次发布的GPU IP新品名为A-Series,没有沿用早前以数字为系列代号的传统,而且似乎还弱化了PowerVR在产品名中的存在……

lzvesmc

20191206-imagination-12.jpglzvesmc

不同类型的操作,整个流程及涉及的模块会有差别,比如像素处理对应3D Data Master,后续要做隐面消除、计算像素渲染等;还有比如一些内部操作(housekeeping operations)、2D操作等等。上图是像素处理流程(Pixel Processing Flow),以紫色示意。lzvesmc

全栈并发的HyperLane技术

以上提到的这些各类别操作,可以通过一种名为“HyperLane”的技术做硬件级并行,这也是Imagination这次随同A-Series GPU IP发布的一种技术。这种技术对内存做完全隔离,多任务同时提交给GPU,实现GPU的多任务执行,或者说GPU硬件的“全栈并发”。典型的比如说图形计算和AI计算同时进行。lzvesmc

20191206-imagination-13.jpglzvesmc

实际针对前文提到的各种不同类型的操作,HyperLane可将GPU的所有任务负载切分成(subdivide)几份,这其中不仅包括了物理层面的隔离切分(模块层面的并发),还包括按照时间切分做负载资源切换。不同的Data Master可以同时保持活跃状态,在整个GPU硬件资源之间进行动态的工作执行,每个时钟周期不同的模块可以执行不同的任务,ALU可以做Compute操作、像素操作、几何图形操作、2D操作等。lzvesmc

20191206-imagination-14.jpglzvesmc

多种颜色表示HyperLane激活的多种操作正在同时进行lzvesmc

另外,HyperLane还有优先级机制,Evans说:“比如有客户希望,在同时执行任务的时候,确保图形计算性能不会受到AI工作负载的影响,那么就可以调高图形计算优先级,即便芯片正在处理复杂的AI任务,图形性能也能被保护起来。”这部分操作需要借用到这次IP架构中的固件处理器(即前文提到的firmware processor)。lzvesmc

HyperLane技术包含了动态的8路切分(eight way split/multi-tasking),也就是至多8条hyperlane。“所有工作同时进行,在硬件层面完整隔离和实现虚拟化,硬件级别的高级调度机制实现灵活性。”lzvesmc

HyperLane的一个副产品是内容保护,每条hyperlane都是隔离的,彼此之间的内容就能实现隔离。Evans说:“比如有个流视频应用,带DRM,那么内容在整个GPU中都是完全隔离起来的,在多任务环境中受到保护。”这也算是种安全防护方案了。lzvesmc

20191206-imagination-15.jpglzvesmc
Imagination PowerVR产品管理和技术营销高级总监Kristof Beetslzvesmc

更多架构变化

我们认为,这次GPU IP改进中的一个亮点应该就是前文多次提到的固件处理器(firmware processor)了(似乎还是RISC-V架构)。即GPU内部有个小型的微控制器,它位于全局最高层级,完全可编程,以实现GPU整体任务执行的灵活性。“相关数据流、执行、优先级等各种GPU内部的活动,任何事件、任何决策,都通过固件处理器来控制和决定。这样一来就大大减轻了CPU的工作,而且还更有弹性。”lzvesmc

20191206-imagination-16.jpglzvesmc

一般来说,GPU的这部分工作是由CPU驱动执行的,而Imagination则把这个活儿揽到了自己手里。这项改进似乎在Imagination的宣传中成效还挺大。典型的就是它能够应用于GPU更好的DVFS调节(动态电压平率调整)——这项工作原本是由内核GPU驱动负责的(所以以后驱动更新都是写入到这枚处理器固件中?)。Beets提到:“固件处理器能够全面感知GPU核心中发生的一切,这对于调度机制很有帮助,它甚至可以用来帮助开发者理解,如何获得GPU的更多性能。”lzvesmc

“如果我们能够了解GPU的工作调度、优先级,查看所有的参数,那么就能够知道何时需要更高的频率,或者可以在某个时间点降低频率。为此,我们的固件中有大量直接的GPIO信号回写,针对功耗控制做同步。GPU直接写回给系统到底发生了什么,这比CPU快多了。这样一来就能实现更出色的DVFS算法,可了解工作负载甚至预测所需的频率。”

原创
本文为国际电子商情原创文章,未经授权禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
黄烨锋
欧阳洋葱,编辑、上海记者,专注成像、移动与半导体,热爱理论技术研究。
  • 微信扫一扫,一键转发

  • 关注“国际电子商情” 微信公众号

  • 穿戴设备强化健康监测功能,带动光电二极管需求成倍增长

    随着强化健康检测性能的需求增温,相关零组件市场仍维持强劲动能。例如为了提升感测数据的准确度,穿戴设备厂商会使用更多的绿光LED与红外线LED...

  • 对付华为?英国立法收紧外资收购限制

    国际电子商情从外媒获悉,由于担心“高风险供应商”华为在英国的商业投入和高校合作学术研究有可能带来“国家安全风险”,英国首相Boris Johnson正准备颁布新法,加强对外资收购英国企业的限制,防止有可能带来“国家安全风险”的外资收购行为...

  • 市场呼求第二代额温枪方案:40度高温下精度仍能达到±0.

    这场在全球持续数月的疫情,仍未有消停的迹象。中国作为首先“摘下口罩”的国家,自然成为了满足海外 防疫物资的中坚力量。然而,一些被政府纳为中国合格制造商“白名单”的额温枪生产商,产品为什么会被海内外客户退回?

  • 2020年1-5月集成电路进口2011.5亿个,增加27.3%

    海关总署最新统计数据显示:今年1-5月,我国货物贸易进出口总值为11.54万亿元人民币,比去年同期(下同)下降4.9%。其中,今年前5个月,进口集成电路2011.5亿个,同比增加27.3%,总价值为8794.3亿元人民币,同比增长14.5%。

  • 疫情影响,预计Q2整体IC市场销售额季减5%

    市调机构IC Insights昨(4)日公布了一份21家半导体公司在2020年二季度的销售业绩指引清单。该清单罗列的公司来自全球各个地区和国家,包含所有半导体种类。该机构预测,2020年第二季度整体IC市场将比2020年第一季度下降6%...

  • A股IPO前5月扎堆过会,科创板上市超四成!(附表)

    有人用“魔幻现实主义”来形容今年的表现,一方面普通群众开始摆起地摊,另一方面更多企业法人走上前往交易所敲钟的道路。 值得注意的是,疫情期间,A股IPO数量似乎并未受到太大的影响。据《国际电子商情》统计,今年已经有124家企业A股IPO过会,其中科创板上市企业超过四成……

近期热点

广告
广告

EE直播间

更多>>

在线研讨会

更多>>