苹果的AI PC、AI手机新功能秋季就要来了,但似乎直到现在为止苹果都没怎么买英伟达的显卡,苹果在AI的布局上究竟是怎么想的?
苹果在今年WWDC上发布了Apple Intelligence,确认各操作系统都要引入生成式AI特性。这对消费电子领域的诸多市场玩家而言是个大事件。因为苹果作为PC、智能手表、智能手机等领域的标杆,新增特性向来是其他竞争者的学习对象。aMVesmc
虽然苹果大谈AI PC和AI手机的时间点相较其他参与者晚了半年,但苹果在AI上布局,从芯片到中间件,走得相对还是比较早的(比如2022年苹果芯片就支持通过Core ML跑Stable Diffusion了)——只不过苹果的AI策略总给人一种力道不足的感觉。aMVesmc
国外分析机构SemiAnalysis的加速器行业模型追踪显示,苹果购买数据中心级别的英伟达显卡数量相比科技行业同级别竞争对手完全不值一提,采购量甚至都排不进前10。这对一家市值万亿的科技公司而言属实有点儿奇怪。aMVesmc
这篇文章就从仅有的公开信息,谈谈苹果的AI布局——不单是表面看到的AI PC和AI手机那么简单。aMVesmc
aMVesmc
照例回顾一下苹果已发布,但还未正式推送(且现状看来中国大陆暂时不会得到Apple Intelligence的大部分能力)的果味AI能力究竟有哪些花样。aMVesmc
在Apple Intelligence支持列表中的苹果设备,更新iOS与macOS新版本以后,具备的AI特性包括备忘录语音转文字、AI照片后期与编辑、Spotlight搜索更快...这些都没什么新鲜的。aMVesmc
表现生成式AI特性的,包括有写作工具、邮件中的增强功能——如收发邮件的关键总结和邮件撰写回复建议;系统通知的智能总结;通话内容转写与总结;更多样化的文生图、基于自然语言的照片与视频搜索;还有Siri强化——学习屏幕上显示的内容,可根据上下文、用户背景信息和使用习惯,更智能地响应用户需求...aMVesmc
aMVesmc
谈得更具体,苹果的生成式AI实现相比竞争对手,由于苹果有着全盘掌控生态的能力,所以在系统中的整合度会显著更高。aMVesmc
所以Apple Intelligence因此能做到不少其他市场参与者无法做到的特性,比如说app之间的协作:在朋友过生日的时候,系统能识别相册中好友的照片,并智能生成以该好友为主题的生日照片,后直接发给好友;甚至Siri能从你的相册中找到你的驾照照片,并在有表单填写需要时,直接为你填写驾照号码...aMVesmc
另外由于深入整合到操作系统,所以在交互方面也有所谓的“行为智能”。比如Siri基于上下文信息能够预测用户接下来要做什么,像是基于邮件中提到的航班时间,提示用户航班计划;或者获取用户在备忘录中写的用餐信息,提示用户要按时到达餐馆等等...本文不再一一列举。aMVesmc
从苹果官方公布的信息来看,苹果对待AI的态度和这家公司做其他消费电子产品类似:虽然苹果也在云侧AI上接入了OpenAI,但整体仍更倾向于用自己的东西。比如其机器学习框架是自己研发的AXLearn;最令人意想不到的应该是据说苹果搭建了基于自家M2 Ultra芯片的AI服务器。aMVesmc
aMVesmc
这则信息是5月份MacRumors给出的。报道中指出苹果用M2 Ultra芯片搭建自己的AI服务器,这是基于分析师的供应链信息。据说当时富士康正组装采用M2 Ultra的苹果AI服务器;而且今年晚些时间还计划组装基于M4系列芯片的AI服务器。aMVesmc
今年6月份的WWDC开发者大会上,苹果也基本确认了构建自有数据中心栈。外媒当时解读,苹果的AI服务器会采用自家芯片和操作系统。aMVesmc
不过苹果并没有说用了什么样的芯片、什么样的操作系统。苹果在技术宣传上一向模糊,当时只提到Private Cloud Compute(私有云计算)的AI特性。这一云上环境据说能更好地跑AI模型——苹果将其称为“将Apple Silicon的能力和安全带到数据中心、为用户构建的服务器硬件”。aMVesmc
在服务器上用自家芯片和操作系统符合苹果垂直整合供应链的常规逻辑。今年3月,Sumit Gupta入职苹果成为云基础设施负责人——此人以往的工作经历包括最早参与英伟达加速计算,且在IBM从事AI相关工作,以及后续加盟谷歌AI基础设施团队——涉足的产品包括谷歌TPU和数据中心CPU,AI硬件方面具备相当的工作经验。可见苹果在构建AI基础设施方面还是相对认真的。aMVesmc
5月份的报道中说苹果会用其自家芯片加强数据中心的性能,并强化依赖于云的AI工具。因为虽然苹果更倾向于将AI负载放在用户端侧本地去跑——尤其考虑到个人隐私,更复杂的AI特性还是需要依托于云的。aMVesmc
但M2 Ultra是面向Mac Studio这类PC或个人工作站设备的SoC芯片;它不是专用的AI加速器,其上还有大量非NPU和GPU的逻辑电路。这则传言真的靠谱吗?aMVesmc
aMVesmc
过去几个月,国外较多媒体报道了苹果当前正就M系列处理器的生产制造做进一步的上量。SemiAnalysis分析文章中提到上量的主要就是M2 Ultra。M2 Ultra作为应用于Mac Studio和Mac Pro设备的高端处理器,在消费用户端的需求始终保持相对稳定。而且从市场大环境来看,PC设备暂时也没有大规模放量的趋势。aMVesmc
那么有较大概率,M2 Ultra还真有可能用于驱动苹果的AI服务器。据说苹果的数据中心短期内就做了双倍扩张——有媒体还公布了苹果数据中心的卫星俯瞰图,并断言明年就会有更大规模的数据中心集群上线。aMVesmc
但从各角度来看,M2 Ultra都不是面向AI数据中心特别好的芯片选择。可能M2 Ultra比较符合AI数据中心需要、或者令它看起来像是数据中心处理器的两个关键部分:先进封装、高内存带宽。aMVesmc
有关M2 Ultra的先进封装技术,电子工程专辑曾在M1 Ultra芯片发布时针对其所用的InFO-LSI(Local Silicon Interconnect)封装技术做过解释。这是一种采用硅桥(Silicon Bridge)实现两片die互联、来自台积电的2.5D封装方案。M2 Ultra用的也是这种方案。aMVesmc
aMVesmc
苹果公布的数据是,M2 Ultra总共1340亿颗晶体管——单就规模来看是远超英伟达H100单芯片的。实际上,在整个PC市场上也很难找到此等规模的处理器。加上数据中心大芯片普遍爱用2.5D/3D先进封装,气质类型上M2 Ultra还是很像数据中心才用得起的芯片——论财大气粗,舍苹果其谁。aMVesmc
而在内存带宽方面,M2 Ultra配备统一内存架构,加上是由两片M2 Max组合而成,标称达到了800GB/s的内存带宽。这也是绝大部分PC处理器望尘莫及的;且单纯就数据中心CPU的内存带宽角度来看,这个数字也算得上优秀。aMVesmc
但可能我们所知M2 Ultra符合数据中心AI处理器芯片的优势项也就仅限于此了。aMVesmc
实际上,即便是苹果引以为傲的内存带宽数字,在显卡界也不怎么够看——面向消费市场的游戏独立显卡就能轻易达到这样的带宽数字,虽然英伟达有在显存容量上节约成本的优良传统……而在数据中心市场,专业图形卡以及像H100/H200这样的加速卡弥补显存容量问题的同时,在显存带宽方面远超M2 Ultra。aMVesmc
真正的问题是,从并行计算加速角度来看,M2 Ultra的浮点运算和AI性能或许在PC领域称得上不错;但到了数据中心市场,大概就只能靠边站了。英伟达H200的显存带宽4.8TB/s,显存容量141GB——而且是HBM3e,FP32算力67 TFLOPS,Tensor core的FP16算力1979 TFLOPS,INT8算力3958 TOPS;aMVesmc
再看看M2 Ultra内存带宽800GB/s,容量192GB,虽然特别配备了NPU——但仅两位数的TOPS算力数字,以及GPU的FP32算力27.2 TFLOPS...就知道M2 Ultra在真正的数据中心加速器面前有多么无力。从直觉判断,M2 Ultra毕竟还是有大量晶体管用在了非GPU/NPU部分。即便H100/H200成本和售价也更高,但从AI服务器单位性能所需的成本,或每1美元可获取的性能角度来看,M2 Ultra也能被甩出几条街。aMVesmc
另一个关键问题是大模型时代的AI负载往往是跨芯片、跨机架乃至跨节点的。虽然不清楚苹果在设计M2 Ultra的微架构时有没有专门考虑过互联和算力扩展问题,即便有过考量(如M2 Max的UltraFusion),作为主要面向消费市场的芯片,要在芯片间的互联效率上比肩NVLink就完全不现实了,和其他非英伟达解决方案也存在差距。aMVesmc
aMVesmc
有关苹果搭建AI基础设施为何没有选择英伟达显卡,部分媒体猜测可能在于苹果与英伟达的陈年往事,包括旧日官司、相关用户的产品纠纷等——想必关注电子科技行业古早历史的读者不会陌生。这大概是个原因,但不是全部。aMVesmc
就AI模型训练的角度来看,苹果选择了牵手谷歌。7月份苹果发布了一份研究paper,题为“Apple Intelligence Foundation Language Model(苹果智能基础语言模型,AFM)”,其中提到苹果的生成式AI模型训练选择使用谷歌TPU。这和Sumit Gupta今年3月份的入职完全对得上;何况还有AXLearn框架是基于JAX计算库等客观原因。aMVesmc
所以在模型训练上选择谷歌的AI基础设施大概是苹果一早就规划好的。谷歌TPU v4和v5是开发AFM模型的AI加速芯片。服务器侧的AFM-server用了8192颗TPU v4芯片训练;设备端30亿参数规模的AFM-on-device模型用2048颗TPU v5训练得到。aMVesmc
Paper中还提到,这两个基础模型是苹果生成式模型家族中的一部分。基于AFM语言模型,苹果还做了像是编程模型——融入到Xcode中;当然还有生图的diffussion模型等。对于苹果在AI模型训练、优化方面感兴趣的读者,可以去看看这份paper。其中也给出了不少AFM模型与竞品的比较:苹果认为自家模型优于Meta, OpenAI, 谷歌这些对手同规模的产品。aMVesmc
模型训练的基础设施基于谷歌TPU,是不是和此前传言苹果用M2 Ultra搭建AI服务器相矛盾呢?应当也不是。这篇paper明确提到了,训练得到的模型一边跑在iPhone、iPad、Mac之类的端侧设备上,一边还要跑在Private Cloud Compute服务器上——也就是现在很流行说的“端云协同”嘛。而这个所谓的私有云计算服务器就是个“Apple Silicon服务器”。aMVesmc
aMVesmc
即便它未必是传言中的M2 Ultra,也至少是Apple Silicon——就传统意义上的AI推理效率来看,M2 Ultra仍然和英伟达Hopper架构的推理GPU相去甚远,如前文分析的那样。一方面这可能和苹果热衷于垂直整合,以及更倾向于一手包办有关;另一方面,以苹果对自家生态的掌控能力,Apple Intelligence的诸多特性是要将AI渗透到整个生态中的。aMVesmc
有分析师认为,因为苹果所有共享底层的完整系统、软件和服务栈都跑在自家芯片上:为达成自下而上的AI能力,操作系统、应用和数据在本地跑一份,在云上也近似地跑一份。就如前文提到的,某些生成式AI特性,诸如通知、文档、通话内容总结,还是需要云的参与。那么原生或近似原生的苹果全栈环境是最友好和高效的。aMVesmc
在需要确保数据和隐私安全、不让敏感数据跑在第三方的前提下,让用户数据跑在采用自家芯片的AI数据中心里是理所应当的。aMVesmc
虽然我们不知道苹果AI技术部署的具体堆栈和架构,但对于上述评论,苹果也在博客文章中透露了少许细节信息。比如说这个Private Cloud Compute集群里会有和iPhone一样的硬件安全技术,如Secure Enclave, Secure Boot;并且其上运行的操作系统是“iOS和macOS为基础的加固的子集(a hardened subset),在确保尽可能小的攻击面的同时,为LLM推理负载量身定做”。aMVesmc
安全特性方面,还格外强调了这套基础设施是连数据中心运维和管理员都受到了大量限制的,完全无法访问终端用户给到模型的信息和数据。aMVesmc
这部分不是要谈苹果用于跑AI的云有多么安全,而在于它可能的确提供了一个类似传统苹果生态的环境,并基于用户的上下文信息进行云侧的AI推理。而这么做大概率就需要以Apple Silicon苹果芯片作为底层支撑。aMVesmc
aMVesmc
如果苹果在后续AI基础设施运营中坚持采用自家芯片——且当前的这颗芯片的确是M2 Ultra,则基本也可以确认M2 Ultra是个短期过渡方案。毕竟从各方面来看,M2 Ultra都不大能胜任AI HPC的工作;而且苹果还可能需要更多互联、存储相关的技术储备或IP授权。aMVesmc
当然,现阶段我们还很难对苹果自古以来喜好做封闭生态,并打算将此延续到生成式AI时代会产生什么样的后果发表评论——毕竟这其中的变数和现实问题还非常多样。比如单是基于这样的思路,怎么在中国推进哪怕是有本地特色的Apple Intelligence都是个巨大的问题。aMVesmc
还要考虑当苹果期望将AI特性相关的更多控制权掌握在手时,更多三方厂商的合作问题——无论是应用开发者还是为开发者提供服务器的其他AI服务供应商;苹果将如何权衡这其中的控制权,乃至对整个生态的控制问题。这也涉及到了生成式AI作为增值服务的商业模式,相关苹果与开发者的收益分配。aMVesmc
另外,作为全球最大且用户基础最为广泛的消费电子企业,当其iPhone和Mac的Apple Intelligence服务全面上线时,AI基础设施将经受全球海量用户的访问和请求压力,这是苹果自己及作为合作方的OpenAI或谷歌可能都需要做好准备的。或许这也将成为生成式AI全面亲近普通消费用户的第一份颇有分量的答卷。(话又说回来,OpenAI的基础设施不就是英伟达的吗?…aMVesmc
微信扫一扫,一键转发
关注“国际电子商情” 微信公众号
过去几年,对能源电网现代化和数字化的投资未能跟上能源需求和要求的步伐。
对全球供应链而言,2024年是极为动荡的一年——众多挑战交织在一起,对全球企业和政府的应对能力提出了严峻的考验。
挑战依然存在,包括产能过剩、市场竞争以及供应链可能中断。
数字钥匙为汽车原始设备制造商(OEM)提供了一种展示其数字能力的强大方式,为客户提供无缝、增值的车辆访问和被动启动功能。
随着配套技术的发展,移动机器人已经准备好进入新的市场,改变制造业、最后一英里配送、农业和医疗保健。
机器人密度是衡量全球制造业自动化程度的晴雨表。
全球领先的半导体公司意法半导体(STMicroelectronics,ST)的微控制器(MCU)销量在2024年前九个月暴跌,该公司将其部分归咎于2022年和2023年签订的不可取消和不可重新安排的销售合同。
拜登政府正急于在特朗普上台前发放更多 530 亿美元的《芯片法案》补贴
2024年,全球经济急转直下,停滞性通货膨胀、通货紧缩、资产负债表衰退,财富被“灰犀牛”吞噬。电子元器件分销商在经济动荡中日子也不好过,面对需求不及预期、供需波动、库存压力、供应链风险、市场竞争、技术变革、数字化挑战,及地缘政治不确定性。
根据最近的市场研究报告和销售趋势判断,到 2024 年,印度芯片市场规模可能超过日本和欧洲。
三星电子近期遭遇外资大规模抛售,市值蒸发近90万亿韩元,股价跌至5万点,创下1年零7个月来的新低。
8 月份销售总额创下历史新高
2024年第四季度,全球智能手机市场增长3%,达到3.3亿台。
据TrendForce集邦咨询最新调查,2024年中国动力及储能电芯价格历经长期下跌后,至第四季跌幅收敛。
2024年,全球PC市场趋于稳定,并于2025年全盘复苏,进入商用市场更新周期。
预估含AI训练、AIGC解决方案在内的全球机器人大型语言模型(机器人LLM)市场,有望于2028年超越1,000亿美元。
2024年是企业拥抱变化、把握机遇的一年。
为了保持领先地位,行业领导者必须专注于创新功能、区域市场动态和战略差异化。
2024年全球智能手机面板出货量有望突破22.6亿片,同比增长8.7%,创下历史新高。主流手机品牌全球面板采购量(不包
生成式人工智能也许是去年讨论度最高的话题,而2025年将是新技术通过一系列移动产品接受“实地检验”的一年,从
根据TrendForce集邦咨询最新调查,2024年整体Server产值估约达3060亿美元,其中,AI Server成长动能优于一般型Ser
刚刚过去的2024年,存储市场上演了一出“冰与火之歌”:终端市场消费电子复苏迟缓,AI应用则继续强势突围。存储产
当前,中国集成电路产业发展逐渐向好,但集成电路产业的人才发展仍面临着严峻挑战。
2025年AI Server需求仍将持续增长。
雅加达,印尼- 2025年1月14日 - 全球技术解决方案供应商艾睿电子(Arrow Electronics)与印尼初创协会合作(STARFIN
无畏挑战 共创未来祥龙回首留胜景,金蛇起舞贺新程。在2025年元旦新年之际,深圳市凯新达科技有限公司(以下简
最新Wi-Fi HaLow片上系统(SoC)为物联网的性能、效率、安全性与多功能性设立新标准;
配套USB网关,轻松实现Wi-
随着与三安光电的碳化硅合资工厂落地重庆,2024年6月,意法半导体与重庆市彭水自治县同步启动了可持续发展合作
凯新达科技 自由之旅 征途同行
NVIDIA Jetson Orin™ Nano Super 开发者套件是一款尺寸小巧且性能强大的超级计算机,重新定义了小型边
德州仪器今日推出了全新的集成式汽车芯片,能够帮助各个价位车辆的驾乘人员,实现更安全、更具沉浸感的驾驶体验
广州飞虹半导体科技有限公司成立于广州越秀区,诚信经营20多年。主要研发、生产、经营:场效应管、三极管等半
近日,半导体存储品牌企业江波龙与工业和信息化部电子第五研究所(中国赛宝实验室,以下简称“电子五所”)在江波龙
深圳迈巨微电子有限公司深耕锂电池管理芯片领域,围绕电池健康和安全,电池电量计算二个核心技术能力,提供完善的
专为下一代电动汽车基础设施而设计,为高能效车载充电和逆变器提供结构紧凑的单元件解决方案。
可实现电信、数据中心和专业音频/视频设备市场的无缝集成。
点击查看更多
北京科能广告有限公司深圳分公司 版权所有
分享到微信
分享到微博
分享到QQ空间
推荐使用浏览器内置分享
分享至朋友圈