AI领域的从业者认为,ChatGPT是AIGC(AI Generated Content,利用人工智能技术来生成内容)应用的新起点,随着深度学习模型不断完善、开源模式的推动、大模型探索商业化的可能,AIGC有望进入应用爆发期。ChatGPT技术的商用落地,对半导体行业有哪些推动作用?
当前,最火的人工智能(AI)应用当属ChatGPT,它是OpenAI发布的聊天机器人程序。ChatGPT与用户对话时可结合上下文做出反应,还支持写代码、写邮件、写脚本、写文案等文字输出型任务。LRPesmc
由于ChatGPT在问答环节的优异表现,该程序一经推出就受到了全球市场的关注,上线两个月后注册用户人数就突破一亿。在此背景下,ChatGPT背后蕴含的巨大市场潜力还有待挖掘,该技术可望撬动海量的应用场景。LRPesmc
AI领域的从业者认为,ChatGPT是AIGC(AI Generated Content,利用人工智能技术来生成内容)应用的新起点,随着深度学习模型不断完善、开源模式的推动、大模型探索商业化的可能,AIGC有望进入应用爆发期。ChatGPT技术的商用落地,对半导体行业有哪些推动作用?LRPesmc
从本质上而言,ChatGPT是一类AI语言模型。官方资料显示,ChatGPT是在GPT 3.5模型基础上微调而成。ChatGPT与InstructGPT是姊妹模型,它们均采用了大型语言模型(Large Language Model,LLM)生成领域的新训练范式——RLHF(Reinforcement Learning from Human Feedback),即以强化学习方式依据人类反馈优化语言模型,两者仅在数据收集设置上有细微区别。LRPesmc
根据ChatGPT向用户的透露的信息,RLHF是一种使用了强化学习的方式,可直接优化带有人类反馈的语言模型。实际上,它涉及到多个模型和不同训练阶段,其技术可大致分解为以下三点:第一,预训练一个语言模型(LM) ;第二,聚合问答数据并训练一个奖励模型(Reward Model,RM);第三,用强化学习(RL)方式微调LM。总而言之,RLHF可增强人类对模型输出结果的调节,并且还能对结果进行更具理解性的排序。LRPesmc
LRPesmc
关于ChatGPT的介绍 图片来源:OpenAI官网LRPesmc
再观察GPT 3.5之前的GPT-3模型,其参数量高达1,750亿个,训练所需数据量达45TB。通过使用RLHF的训练方法,即使InstructGPT只有13亿个参数量,它的输出效果也依旧优于GPT-3。OpenAI公布的资料显示,InstructGPT与ChatGPT是姊妹模型,由此可猜测两者的参数量可能相差不大。LRPesmc
也许有读者对于参数量缺乏具体的概念,本文通过列举一个通俗的例子来解释——2020年9月,微软获得了OpenAI GPT-3的独家授权,该公司为训练GPT-3建设了一个超算中心,该中心的超级计算机装载了一万张英伟达GPU。而训练GPT-3消耗了微软355个GPU年的算力(1块GPU运行355年的算力),单次训练费用更是高达460万美元。不过,截至发稿日,笔者未查询到ChatGPT模型训练费用信息。LRPesmc
ChatGPT是一个AI模型,它离不开算力的支持——在训练阶段,需要大量的语料数据来训练模型,在应用阶段,需要大算力服务器来支持模型的运行。即使ChatGPT的参数量可减少到数十亿个,训练和运行它也需消耗很大的计算资源。LRPesmc
OpenAI ChatGPT的现象级走红,推动科技公司加快类ChatGPT产品的部署。近期,谷歌、微软、百度等企业都宣布将提供AI模型服务,其中谷歌将推出由LaMDA模型支持的对话式人工智能服务Bard,微软在搜索引擎Bing中嵌入了OpenAI的GPT-3.5,百度将推大模型新项目“文心一言”,最初版本将嵌入搜索服务中。LRPesmc
随着更多科技公司部署类ChatGPT服务,为训练AI模型将需要巨大的算力,这种需求也让一些企业看到了AI算力服务的商机。2023年2月10日,浪潮信息推出AI算力服务产品。该公司表示,将基于中国领先智算中心的算力基础设施,为中国客户提供AI算力资源和配套服务,支撑AI模型构建、训练和推理的业务全流程,赋力生成式AI产业创新。LRPesmc
当然,资金雄厚的科技巨头可能会搭建自己的计算中心。例如,前文所述的微软的超级计算机,该中心设备用于在Azure公有云上训练超大规模的AI模型。据了解,该中心装载了超过28.5万个CPU、1万个GPU,其中单个GPU服务器的网络连接能力达400Gb/s,该设备算力峰值达每秒可执行23.5-61.4个万亿浮点运算。LRPesmc
购买AI算力服务和搭建计算中心,都需要大规模的计算机设备的支持。LRPesmc
LRPesmc
表1:超级计算机和智能计算机的区别LRPesmc
在进一步讨论时,首先要厘清一个概念——算力是代表处理数字化信息能力的强弱,不同类型的算力存在着较大的差别。比如,超级计算机的算力单位是FLOPS(每秒浮点运算能力),而智能计算机的算力单位是OPS(每秒操作次数),这是两个不同的概念。LRPesmc
另外,衡量算力水平还要考虑算力精度。瞭望智库指出,目前业界用于衡量超级计算的Linpack测试,测试的是超级计算机的“双精度浮点运算能力”,即64位浮点数字的计算(FP64)。此外,在以二进制所表示数字精度中,还有单精度(32位,FP32)、半精度(16位,FP16)以及整数类型(如INT8、INT4)等。数字位数越高,意味着精度越高、可支持的运算复杂程度越高,其能适配应用场景越广。LRPesmc
智能计算机是一种专用算力设备,它在推理或训练等智能计算方面表现出色,但大多数智能计算机不具备高精度数值计算能力;超级计算机是一种通用算力设备,其设计目标是提供完备、复杂的计算能力,在高精度计算能力更强,应用范围更广,主要被科研人员用于行星模拟、新材料开发、基因分析等科学计算和大数据处理。LRPesmc
AI模型训练只需用到智能计算机,但目前的智能计算机技术还不成熟,仅在模式识别、知识处理及开发智能等方面有应用。尽管当前该类设备还未达到预期目标,但它在文字、语音、图形图像识别与理解,以及机器翻译等领域取得了一些进展,同时相关初级产品也已经问世。LRPesmc
如前文所述,AIGC的出现有望撬动AI大规模落地的场景。同时,相关企业在多个AI产业链的布局将更深入。比如,在硬件层包括芯片和传感器,其中AI芯片主要有通用型的GPU、可定制的FPGA、专用的ASIC,以及类脑芯片。英伟达的Orin芯片基于通用GPU,地平线的征程5芯片,既是ASIC芯片,也是DSA(特定领域架构)芯片;类脑芯片有IBM的TrueNorth、英特尔的Loihi、高通的Zeroth、西井科技的DeepSouth、杭州电子科技大学的达尔文、aiCTX的DynapCNN处理器等。LRPesmc
整体而言,AI芯片供应商主要有英伟达、AMD、Intel、VelociHOST、景嘉微、地平线、寒武纪、比特大陆、复旦微、赛灵思、Altera(英特尔旗下)、异构智能、谷歌等;传感器部分有舜宇光学、禾赛科技等供应商;算法层有商汤科技、旷视科技、云从科技、依图科技、第四范式等;应用层有海康威视、科大讯飞、锐明技术等。LRPesmc
虽然智能计算机并不追求太大的算力频率,但是其对芯片的功耗和散热要求较高,所以,低功耗的FPGA和ASIC芯片在智能计算机上有更大的用武之地。与此同时,AI芯片也将从面向厂商的训练场景为主,转变为面向消费者的推理场景为主。业内AI专家对此评价称,GPU的高并行计算能力和高通用性的协调统一,在消费者时代的统治力或许难以为继,未来ASIC芯片、中国产GPGPU芯片或将能切入MaaS(出行即服务)产业生态。LRPesmc
或许会有读者联想到,理论上,更大的算力意味着更多的计算机设备,搭建这些设备也需要更多的核心器件。这是否意味着,企业对类ChatGPT技术的追求,对服务器产业链的发展起到积极的促进作用?LRPesmc
笔者在表2中列举了一些全球服务器产业链信息,主要涉及到关键器件及整机供应商。LRPesmc
LRPesmc
表2:服务器核心器件及整机供应商不完全盘点LRPesmc
服务器主板是专门为满足服务器应用而开发,要求具备高稳定性、高性能、高兼容性的特点。本表列举的服务器主板供应商集中在中国和美国,比如美国的英特尔、超微;中国大陆的联想等,以及中国台湾的华硕、技嘉、微星、泰安(神达旗下)等。LRPesmc
LRPesmc
图1:x86服务器CPU与非x86服务器CPU的市场占比 制图:国际电子商情 数据来源:综合自各研报LRPesmc
截至2023年Q1,全球约有90%的服务器CPU采用x86架构,剩下的10%左右采用非x86架构。目前,英特尔占据了x86服务器CPU 90%以上的市场份额,同为x86架构阵营的AMD虽然近年来在PC CPU领域穷追猛打,但在服务器CPU方面其份额还难以撼动英特尔的地位。IBM的CPU采用Power架构,其全球市场占也比与英特尔低。另外,中国台湾的Cyrix(被威盛电子收购),中国大陆的海思、中科院计算所、天津飞腾、申威科技等也有服务器CPU产品,但这些企业的市占比与英特尔有很大的差距。LRPesmc
AI模型需要大量的深度学习和机器训练,比如参数量达1,750亿个的GPT-3,需要用到大量的英伟达V100(32GB)、A100和H100(80G)GPU产品的支持。目前,英伟达A100、H100 GPU产品已经被亚马逊AWS、微软Azure、谷歌云、甲骨文等公司采用。另据IDC统计资料显示,在中国的GPU服务器领域,英伟达的市占率也高达95%,几乎所有的云服务提供商和超算都采用英伟达的芯片来支持AI计算。LRPesmc
此外,AMD、Intel、VelociHOST等美资企业也生产GPU产品;中国的GPU供应商则有景嘉微、长沙韶光(航景科技子公司)等。LRPesmc
本表格列举的存储相关供应商的业务涉及到内存、外存(硬盘)和内存接口芯片。LRPesmc
目前,内存接口芯片已经升级到DDR5世代,供应商有澜起科技、Rambus、IDT三家。虽然速率为4800MT/s的DDR5在PC笔电的渗透快于服务器,但是只有当传输速率达到6400MT/s时,PC端才需要搭载DDR5内存接口芯片。因此,当前DDR5内存接口芯片在服务器上的应用更多,预计在2022-2024年三年期间,服务器端DDR5的渗透率分别为15%、40%、60%。LRPesmc
内存供应商有韩国的SK海力士、三星电子等,美国的美光科技、金士顿等,中国的金泰克、芝奇(台湾)等;外存供应商有美国的西部数据(含旗下闪迪)、希捷等,中国的联想、金泰克等。LRPesmc
在服务器整机部分,笔者主要列举了中美两国的供应商。LRPesmc
美国有戴尔、HPE、IBM、思科等;中国有华为、新华三、浪潮、联想、中科曙光、山东超越等。LRPesmc
根据目前的市场判断,企业对类ChatGPT技术的追求,将主要推动AI芯片产业的发展,作为算力基础设备的服务器及其产业链,或将有更好的发展机会。2023年3月29至30日,AspenCore将在上海举办国际集成电路展览会暨研讨会(IIC Shanghai 2023),届时,AI视觉芯片供应商爱芯元智,存储相关供应商江波龙、东芯半导体、ISSI,国产高性能服务器CPU供应商飞腾等企业均将参与。同期的EDA/IP 与 IC 设计论坛还将邀请国内外知名EDA/IP、IC设计企业参与演讲,欢迎感兴趣的朋友点击 这里 报名,并到场交流。LRPesmc
超级计算机和智能计算机有多台服务器组成。客观上,科技企业对类ChatGPT服务的追捧,有利于全球服务器产业链的发展,但是这种作用恐怕难以在短期内体现。据分析机构的预测,2023年全球服务器整机市场的表现并不太好。LRPesmc
2023年1月底,集邦咨询修正了对2023年全球服务器整机市场的预测数据,增速下调至1.87%。该机构表示,受全球经济持续疲软影响,北美四大云端服务供应商下修了2023年服务器采购量,且数字可能将持续下调,下修幅度从大到小依次为Meta、微软、谷歌、亚马逊云科技。这四家企业的服务器采购量由原先预估的同比增长6.9%,降至4.4%,这将影响2023年全球服务器整机出货年增率下降到1.87%。LRPesmc
其实,已确定部署类ChatGPT的企业,主要是一些规模大、实力强的巨头,毕竟部署这类业务需要极大的算力,训练和验证模型的成本也非常昂贵。相信随着更多此类技术进一步产业化,市场上还会出现不同的细分业务模式。LRPesmc
微信扫一扫,一键转发
关注“国际电子商情” 微信公众号
去年一整年的半导体、电子产业市场分析数据都很有趣。从年初对市场的绝对误判,到年中的部分修正,到年底的市场全面步入下行期收尾。
人际关系在电子元器件分销界中尤为重要。
国际电子商情1日消息,国家统计局今日在官网发布了2022国民经济和社会发展统计公报。
2022年,尽管受疫情散发频发、芯片结构性短缺、动力电池原材料价格高位运行等诸多不利因素冲击,但在购置税减半等一系列稳增长、促消费政策的有效拉动下,中国汽车市场在逆境下实现正增长。
近日,市调机构在其发布的报告预测,2023年的Server DRAM位元产出比重约37.6%,将正式超越Mobile DRAM的36.8%。
日本电子与信息技术工业协会最新数据显示,市场需求减少背景下,电子元器件的出货额持续缩减,2022年12月份日本电子零件厂全球出货更是遭遇两年来最大减幅……
到2023年Q1,半导体市场两极分化的现象更加突出,消费电子和汽车电子市场有了新的变化。一方面,消费电子产品需求疲软,消费级IC产能出现过剩,产业链企业业绩遇冷并出现大裁员、减产;另一方面,新能源汽车需求持续旺盛,车规级IC步入结构性缺货阶段,大缺货期间启动的晶圆扩厂项目开始陆续达产,新产线的运营需要更多的半导体专业人才。
国际电子商情28日讯 据外媒报道,在过去的2022年,美国批准了70%中国出口许可申请……
国际电子商情28日讯 昨(27)日晚间,中国自主新能源汽车品牌——理想汽车发布第四季度及全年业绩。这家造车新势力2022年全年实现营收452.9亿元,虽然同比增长67.7%,但其全年净亏损达到20.3亿元,净亏损额较2021年扩大5倍有余。
国际电子商情23日讯 外媒消息称,为了即将在下半年推出的iPhone 15 Pro系列以及新款MacBook做准备,苹果已经拿下了台积电3纳米全部产能……
2023年2月23日,在由AspenCore和上海市交通电子行业协会联合主办的《2022中国国际汽车电子高峰论坛》上,罗兰贝格合伙人庄景乾分享了该机构对中国车载半导体产业链的最新研判。
国际电子商情22日讯 外媒消息称,为了带动“美国制造”,在过去的2022年,美国各州和地方通过提高补贴、税收减免等方式以吸引芯片和电动汽车工厂在本地设厂……
近日,四川省发展改革委公布2023年四川省重点工业和技术改造项目名单。
【招银研究|宏观点评】经济修复提速——2023年2月PMI数据点评。
TrendForce集邦咨询研究显示,2022年第四季DRAM产业营收122.8亿美元,环比下降32.5%,跌幅甚至超越第三季的28.9%,
高通与泰雷兹在2023年世界移动大会上宣布,全球首个符合GSMA标准的可商用部署的iSIM在骁龙8 Gen 2移动平台上
日本软银集团旗下芯片设计公司Arm或将从英国伦敦转向美国纽约上市。据《彭博社》报道,Arm已决定暂时不在英国
近日,高华科技、派瑞特气、颀中科技、南芯科技、中科飞测等多家半导体公司科创板IPO申请迎来新的进展,证监会
2012年以前,我国的PLC光分路器芯片全部依赖进口,对方一个芯片卖五六百块钱。而近日,中国“20多位中科院专家把
按产品分类的机器人医学成像市场规模(超声设备、血管造影设备、X 射线设备、CT 扫描仪、MRI 扫描仪)
【招银研究|宏观点评】精准有力,平稳连续——《2022年四季度货币政策执行报告》点评
近日,4家LED相关企业发布了2022业绩快报,艾比森、海目星净利润大增,德龙激光净利润下滑,深科达由盈转亏。
ChatGPT近期掀起云端与AI产业话题,Microsoft、Google、百度等相继推出基于生成式AI衍生的产品服务。在此热潮
2022年第四季度,全球个人智能音频设备出货量下降26%,跌至1.1亿部。
作为超大规模集成电路设计科技创新企业,忆芯科技已先后完成了四颗高端消费级/企业级PCIe SSD主控芯片流片,并
成都复锦功率半导体技术发展有限公司首批产品即将亮相,现面向全国发起代理商招募行动,诚邀各优质区域合作伙伴
2月28日,2023年GTI国际产业峰会在西班牙巴塞罗那举行,中国移动总经理董昕出席大会,并作题为“和合与共 四海一
近日,汇顶科技与北京亚华物联科技发展有限公司共同发布创新智能燃气表解决方案。该方案搭载汇顶科技领先的NB
安富利发布首个基于AWS服务打造的IoTConnect平台。该平台预置AWS物联网(IoT)和云服务,可助力OEM厂商实现简单、
“成电协·会员行”专题内容团队今天走进的正是在显示器领域深耕了14载,致力于赋能全球数字化设备发展的优秀
日前,Vicor公司宣布与电子元器件代理及服务全球分销商安富利签署分销协议。
天线测量解决方案领导者Microwave Vision Group(MVG)近日宣布,移动网络无线基础设施的领先供应商——安费诺
近期,亚太区领先的电子元器件分销商Excelpoint世健公司有多个喜报传来。世健系统(香港)有限公司获得了来自供应
近些年来,电子产业可谓热点不断,从云计算、5G、IoT/IIoT、大数据,到AR、VR,再到新能源汽车、人工智能,真有些眼花
近日(2023年2月18日),全球领先的惯性MEMS传感器供应商美新半导体发布新款AMR地磁传感器MMC5616WA, 全新升级了美
飞英思特科技宣告研发出国内首款环境微能量采集与管理芯片FPM8100,实现国内该类芯片产品零的突破,填补了市场
分享到微信
分享到微博
分享到QQ空间
推荐使用浏览器内置分享
分享至朋友圈