最近数据中心GPU的价格可谓水涨船高——AI热度不减,似乎很多企业都期望借着生成式AI的东风发展一把——至少是不能输给竞争对手。热钱涌向大模型AI技术初创公司的趋势也还在。基于自家数据或行业训练模型,尤其LLM,当然就需要大量算力。
对应英伟达、AMD的GPU自然就变得相当紧俏了,紧俏到国内H800、A800价格开始飙升——当然和美国可能再度收紧技术控制的消息面有关;紧俏到连OpenAI都说近期GPU用量成为发展瓶颈;甚至紧俏到国外已经有AI技术公司开始买游戏显卡来获得算力;紧俏到国外媒体担忧这会不会引发新一波的游戏显卡涨价热潮...IHMesmc
据说英伟达H100到明年Q1之前,都将处于售罄状态,只不过英伟达已经打算开足马力提高供货能力了:每季度H100新增40万张出货量。这么一说,市场还真可谓东边太阳西边雨啊——同为尖端制造工艺,手机、PC市场又是何等模样。但大概也正是手机、PC当前的寥落,才让英伟达有机会在H100这样的HPC大芯片立马增加供货。IHMesmc
IHMesmc
此前我们就报道过,受到行业下行期持续,及消费电子市场颓势的影响,台积电N5工艺的产能利用率已经跌到了70%以下。和N5同代的4nm工艺,包括英伟达Hopper架构GPU所用的4N工艺,也在其中。这其实也某种程度缓解了了AI大芯片供不上货的尴尬。但问题是,作为一颗完整的芯片,乃至完整的加速卡,像H100这样的紧俏货,供应链的瓶颈可能并不在前道fab制造部分。IHMesmc
SemiAnalysis最近撰文推测了当前数据中心显卡供不应求的瓶颈所在,结合他们的分析,我们来谈谈这条供应链的现状。IHMesmc
先谈一个基础事实,对于数据中心GPU而言,显卡或加速卡中间的那颗芯片——封装在一起的除了中央主要做计算的die——也就是GPU最精华的部分,这颗die的四周通常还围绕着存储die,也就是显卡的内存部分。IHMesmc
对大部分图形显卡来说,内存更多会选用GDDR,GDDR颗粒其实不会和计算die封装在同一颗芯片上——比如以英伟达GeForce RTX 4090显卡为例,能很明确看到中央GPU芯片周围围绕的GDDR内存,和GPU die离得还比较远。IHMesmc
但数据中心HPC/AI显卡的带宽需求明显增大——尤其大模型上马以后,这类GPU就会采用规格更高的HBM(High Bandwidth Memory)内存。HBM通过先进封装的方式,与计算die封装在一颗芯片上,比如下图这样(注意彩色die周围的那6颗黑色HBM)。IHMesmc
IHMesmc
前两年我们还特别撰文探讨过HBM——这种内存最早是AMD应用到GPU上,但很显然现在主要的用量都在英伟达这边。AMD早在游戏显卡上就尝试过HBM,而英伟达则是在2016年的Tesla架构数据中心GPU上开始采用HBM内存。HBM本身是一种将DRAM die在垂直方向叠起来的高带宽内存,现在常见的HBM会叠8层;最新的一批加速卡可能会叠至多12层die,比如AMD的MI300X。IHMesmc
HBM通过大量增加pin数达成了1024bit位宽,相比内存中比较常见的DDR提升了16倍,带宽自然不在一个量级——现在最先进的HBM3标称的带宽甚至已经达到了1075GB/s,I/O速度8.4Gbps;与此同时每bit数据传输消耗能量显著低于DDR规格,这和数据通路长度也有一定关系——也就涉及到HBM常规的封装方式了。IHMesmc
IHMesmc
HBM内存通过2.5D封装的方式,和GPU计算die放在同一颗芯片上。有关2.5D封装,此前好些文章都详细谈过了。一般当代数据中心GPU,除了底下的封装基板之外,会有一层硅中介(silicon interposer),HBM die和GPU的计算die都放在硅中介上面,然后两片die通过硅中介来达成互联。这是现在用HBM内存的GPU一般都会选择的先进封装方式。IHMesmc
如前文所述,GPU的计算die所需的fab前道尖端制造工艺,因为手机、PC空余了不少产能,所以逻辑计算die的制造并不会成为产能瓶颈,那么瓶颈会不会在HBM内存上呢?IHMesmc
现在造HBM颗粒的主要市场玩家有三个,分别是SK海力士(SK Hynix)、三星、美光。SemiAnalysis提到,SK海力士是这一市场的最大赢家——这家公司2022年6月开始生产HBM3,是目前唯一能够量产HBM3的企业,超过95%的市场份额——也是绝大部分英伟达H100产品的HBM内存供应来源。AMD MI300X和接下来的英伟达H100 refresh都会用SK海力士的12层24GB HBM3内存。IHMesmc
三星此前发布消息称,其HBM3内存产品会在2023年下半年出货。虽然三星在HBM产品上的步伐走得明显不如SK海力士那么快,但三星在这一市场的投入也相当巨大,要从SK海力士的手中抢夺市场的信心也相当充足。另外,三星路线图显示,他们还准备在HBM4之上就逻辑外围引入FinFET结构器件,这也是其相较另外两家对手的优势项。IHMesmc
美光相比另外两家,步子走得明显比较慢。主要原因是美光前期在HMC技术上投入不少,这原本是HBM的有力竞争技术,无奈受制于生态和某些技术问题,HBM最终成为毫无疑问的行业标准。美光转向HBM之时,就已经落后于SK海力士和三星了。SemiAnalysis消息称,美光目前仍然卡在HBM2E上。但美光在最近的财报电话会议上说2024年就会在HBM3E技术上实现领先,并且Q3、Q4就为英伟达的下一代GPU提供HBM3E内存。IHMesmc
看起来HBM并不是这波数据中心显卡供货的瓶颈。IHMesmc
如果说HBM内存颗粒本身并非供货瓶颈,GPU计算die也不是,那么在成本大头方面,还有一项就是将两者封装到一起的先进封装技术了。至少SemiAnalysis认为,当前GPU供货的主要瓶颈就是台积电CoWoS封装。IHMesmc
只要采用HBM内存,除了会有少部分高算力HPC加速芯片采用三星的2.5D封装方案,绝大部分都会用台积电CoWoS封装。某些networking、超算、FPGA芯片也会选择CoWoS封装,但CoWoS的需求大头基本都是AI芯片。国内典型用了CoWoS技术的如壁仞GPU芯片BR100。IHMesmc
可以说,CoWoS、HBM某种程度上已经成为主要面向AI的技术。也正因如此,CoWoS不像别的技术那样,可以从其他类型或应用的芯片上转移过来,实际上CoWoS的产能今年Q1就已经占得很满。在GPU需求量爆发之际,供应链也变得因此跟不上GPU供给。三星、Intel,以及个别OSAT封测厂——典型如日月光其实也掌握2.5D封装技术,但就AI芯片市场,台积电CoWoS是绝对主流。IHMesmc
此前台积电表示已经有客户致电提出后道封装产能扩张需求,尤其是CoWoS封装,台积电称正在做这方面的评估。只不过当时台积电应该并未预期AI需求来得这么快。今年6月,台积电宣布开启先进后道fab 6工厂,其洁净间面积能够达成3D Fabric产能每年100万片wafer。当然这些产能并不都是给CoWoS的,还包括扇出型封装、3D堆叠等。IHMesmc
值得一提的是,台积电wafer level fan-out晶圆级扇出型封装现阶段的产能利用率是不足的,很显然是因为手机AP SoC的需求量低了,毕竟手机芯片是扇出型封装的主场。扇出型封装的某些工艺步骤和CoWoS是相似的,比如说沉积、电镀、RDL成型等。那么扇出型封装的部分产能可以分配给CoWoS。IHMesmc
当然CoWoS技术其实有好几种不同的类型,我们日常说的最多的用硅中介的方案是CoWoS-S;另外还有不用硅中介,而采用RDL重分布层、成本更低的CoWoS-R,以及类似于Intel EMIB硅桥方案的CoWoS-L。这些以前我们都分析过,这些就不细谈了。IHMesmc
IHMesmc
来源:SemiAnalysisIHMesmc
SemiAnalysis给出了一张当前台积电CoWoS客户产能分布图——有关这张图更详细的分析,可以移步SemiAnalysis的原文。目前CoWoS客户大头毫无疑问是英伟达,过去好几年都是这样——随着H100的持续扩产,未来这种局面也不会变。预计到2024年下半年,英伟达的下一代GPU封装尺寸可能会达到H100的两倍还多,则对封装也就提出了更高的要求。IHMesmc
据说英伟达有想过在封装方面采用双供应商的策略,但三星的先进封装技术方案和产能都让英伟达不够满意;Amkor则无法提供完整的端到端2.5D工艺技术——也就是说一整套流程是需要其他参与者打配合的——不过我们此前也谈过,这可能是传统OSAT于先进封装时代的出路。IHMesmc
要知道英伟达过去就fab前道制造始终保持着多供应商的思路,避免过度依赖。但现如今暂时只能主要依靠台积电,即便未来这种局面可能会发生变化。IHMesmc
台积电CoWoS的第二号大客户是博通——当然了,主要需求其实是博通深度参与的谷歌TPU芯片,尤其TPU v5从今年Q2开始起量——加上谷歌现如今不仅在传统业务上有需求,还期望在生成式AI上能够赶上OpenAI;博通自己也有networking芯片方面的一些需求,另外Meta的设计业务也会带来一些量。IHMesmc
另外的一些CoWoS客户依次还包括了Marvell、AMD与赛灵思、Alchip、微软、平头哥、思科等。其中实则涉及到这些芯片设计公司的下游客户,比如亚马逊Trainium等。IHMesmc
SemiAnalysis并未在分析中指明数据中心GPU瓶颈若在CoWoS封装上,具体表现在怎样的数量级上——大概是基于现有市场需求量,及台积电可提供的CoWoS产能做出的。IHMesmc
我们认为,这个推测也是完全合理的。前不久的慕展上,我们走访了多家先进封装设备供应商,有厂商发言人明确告诉我们,台积电作为半导体制造的前道fab角色主力,虽然也在做先进封装——且先进封装亦的确为未来市场方向;但从利润率的角度来看,后道封装业务是在拖后腿的,这使得台积电在先进封装技术的扩产上显得意兴阑珊。IHMesmc
所以台积电谈到要将这部分产能转移给OSAT,缓解产能问题,实际可能是从营收的角度所做的权衡。此前我们分析台积电Q1季报时,就提过,2022年台积电营收占比中7%来自先进封装;预计到2023年,这个值仍然保持在6%-7%。当然这和扇出型封装营收下降可能有关,但也可能表明了台积电在封装技术上做扩产的保守选择。IHMesmc
接下来几个月,观察英伟达数据中心GPU的供货情况,及出货量变化,可进一步明确台积电这方面的思路和发展策略。IHMesmc
微信扫一扫,一键转发
关注“国际电子商情” 微信公众号
一旦强大的量子计算机到来,目前数十亿计算设备使用的加密算法将面临风险。
近日,市调机构在其发布的报告预测,2023年的Server DRAM位元产出比重约37.6%,将正式超越Mobile DRAM的36.8%。
FPGA市场在过去几年经历了快速增长。数据显示,2020-2021年,全球FPGA市场增长速度为16%,此后,到2027年,该市场预计将以12%的年复合增长率持续成长,并达到130亿美元的规模。而中国市场的增速则会更快,预计未来5年的增长率将保持在18%左右。
AMD市场Q3 GPU份额环比下降8.5%,英特尔市场份额增长10.3%,Nvidia市场份额下降-1.87%
小米 MIX Fold2发售于今年的8月,作为一款折叠屏手机,小米 MIX Fold2的机身厚度在展开时为5.4毫米,折叠时为11.2毫米,重量则为262克厚度。在同类折叠方案中,属于较轻薄的。拆解机构eWiseTech日前对这款手机进行了拆解,一起来看看...
从微单刚诞生时,只能用来拍拍旅游风景照,到现如今应用于严肃生产,实则也体现了电子科技这些年来的神速发展……
国际电子商情7日讯 eWisetech翻出了自2021年至2022年6月拆解的54台手机设备,就部件厂商分布情况做了分享,一起来看看...
国际电子商情22日讯 据市调机构最新调查报告,尽管面临着全球宏观经济衰退以及中国这个最大物联网市场的封锁等问题,2022年Q2全球蜂窝物联网模组出货量仍年增20%。
国际电子商情讯 据市调机构调查数据显示,尽管5G继续成为Q1基带市场增长主力,但除5G外,所有其他基带业务的出货量和收入都出现下滑...
在RISC-V出现之前,历史上已经出现过多种指令集架构(ISA),比如DEC(PDP-11、VAX、Alpha)、英特尔(i960、i860、Itanium)、IBM 360、MIPS、SPARC、Arm等,各自命运跌宕起伏。其中,IBM 360指令集架构拥有超过50年的历史,是现存最老的指令集架构,得益于良好的软件生态,IBM目前仍能够销售大型机;MIPS先后被卖给了Imagination和Wave Computing公司,现在也走上了开源的道路;Sun公司将SPARC开源后又被Oracle公司并购,如今已消失无影踪...
上个月,小米12S系列正式发布,作为顶配的Ultra版堪称年度“堆料”机皇,口碑及销量将较去年明显提升。“享拆”等自媒体对这款手机进行了拆解和测评,我们也得以窥探小米12S Ultra的物料成本情况...
本月推荐8款新品,分别来自:安谋科技、Microchip、英飞凌、Transphorm和Vishay。
政策补贴加成效应消失。
由于拆板颗粒持续供应,DDR4价格仍持续下跌。
8月上旬,电视各尺寸面板价格继续保持上涨趋势。
历时逾9个月,华虹公司于8月7日正式上市,募资212亿元,成为年内最大IPO,也是科创板史上第三大IPO(募资额仅次于中芯
上周,功率半导体大厂英飞凌宣布,计划在未来五年内投资高达50亿欧元,用于在马来西亚居林建造全球最大的8英寸SiC
2023年第二季度,全球平板电脑出货量延续上一季度的颓势,同比下滑11%至3100万台,这是自2020年第一季度以来的最
8月4日,成都市经济和信息化局和成都市新经济发展委员会印发了《成都市加快大模型创新应用推进人工智能产业高
近期,高通、恩智浦、博世、英飞凌及Nordic五大产业龙头公司宣布携手共同投资组建一家芯片公司,专攻RISC-V架构
TechInsights的最新数据显示,2023年Q2,中国智能手机出货量同比下降5%,这是过去十年以来最糟糕的第二季度。
近两年随着汽车产销量的逐渐回暖和存量市场的崛起,以及消费者对车载显示屏的娱乐需求及功能需求升级,各大面板
AI芯片、碳化硅等半导体细分领域的逆势增长,给予行业更多信心。在全球半导体产业低迷周期,英飞凌、英特尔仍在
根据TechInsights的最新研究, 2023年Q2全球智能手机出货量比下降-8% ,至2.69亿部。
历经12个月的认证周期,成功收获TÜV莱茵颁发的第二张功能安全产品认证,标志芯思维再次在数字电路逻辑仿真领域
2006年,世界银行发布的第8号文件估计,全球每年的无收益水成本高达140亿美元。智能水务管理的市场非常广阔……
作为一场全球性的高精尖科技盛会,中国国际高新技术成果交易会成为洞察全球市场新需求、行业发展新趋势、人才
半导体是高技术壁垒、重资产和低回报的行业,显著的特点是产业链在全世界分布。
9月5日-6日, 2023 | 海南·海口
Arm 和我们的生态系统的关键信念之一是与开源社区合作,共创一个高度发达的 Arm 架构,使软件的落地更加稳定
航顺芯片经过多年发展后为更快速的人才集聚和弥补核心技术商业化,采取先投资,双方团队磨合后并购32位MCU研发
通过替换现有的Si MOSFET,可将器件体积减少约99%,功率损耗减少约55%
2023年7月20日,B2B电子元器件交易平台ICZOOM Group Inc.(纳斯达克股票代码:IZM)(“公司”或“ICZ
2023年7月15日顶讯科技华东区用户见面会圆满收官,感谢华东区客户朋友们对易宝软件的信任和给予顶讯团队的鼎
8月23日-24日, 2023 | 四川·广汉
1979年,在祖国万里疆土的华南沿海,一个小渔村——深圳成为了全国目光的焦点,中国经济自此逐渐开始
点击查看更多
北京科能广告有限公司深圳分公司 版权所有
分享到微信
分享到微博
分享到QQ空间
推荐使用浏览器内置分享
分享至朋友圈