与大多数应用程序不同,虽然ChatGPT软件正在步入正轨,但是支持运行该应用程序的硬件却并非如此。
生成式人工智能(AI)的大规模落地取决于提高处理效率和降低总拥有成本。与互联网及其万维网应用程序的发明类似,生成式人工智能已经抓住了公众的想象力。ChatGPT技术一经发布就受到了各界的广泛关注,它是迄今为止用户增长最快的应用程序,仅在问世的前两个月内,注册用户数就突破了1亿人。cUIesmc
生成式AI正取得所有行业的关注,并有望释放出无与伦比的生产力浪潮。具体来看,生成式AI的市场潜力巨大,它可助力多个领域的发展,比如,辅助药物研发,提高医生诊断准确率,提高订单预测准确率,以及帮助程序员编写高质量软件代码。预计每年将能为全球经济增加4万亿美元以上的价值。cUIesmc
与大多数应用程序不同,虽然ChatGPT软件正在步入正轨,但是支持运行该应用程序的硬件却并非如此。cUIesmc
生成式AI大语言模型所面临的硬件挑战来源于——算法使用了大量的参数来生成结果。例如,ChatGPT的前一代模型GPT-3.5需要1,750亿个参数,虽然官方暂未公布GPT-4版的参数量,但是机构预估其参数量约有1.7万亿个。对此,支持生成式AI大语言模型的AI硬件加速器必须扩展到能够处理1,750亿到近2万亿个参数的标准,才能满足每个用户的查询操作。cUIesmc
在当前的计算架构上,处理器核心和存储器之间的大量数据流,通常在计算核心外部来进行处理。这种设置会导致内存瓶颈的出现,通常它也被称为“内存墙”,会带来严重的带宽限制。cUIesmc
以上因素不仅排除了CPU计算架构,而且还排除了GPU等其他AI计算架构。以GPT-4为例,其中高端的GPU约有97%的时间处于空闲状态,这相当于大约只有3%的效率。在这样的低效率下,一个标称计算能力为1 PetaOPS(每秒一千兆/一千万亿次运算)的处理器,只能产生大约30 teraOPS(每秒一兆/一万亿次运算)的处理速度。cUIesmc
如今,这些算法在高性能计算集群上执行,每个集群需要消耗大量的能源。随之而来的问题是,执行ChatGPT-4用户查询所需的功耗已经超出极限,这导致发电厂超载和能源分配网络压力过大。cUIesmc
ChatGPT的功耗并非阻碍其商用落地的全部因素。ChatGPT技术的快速推出,进一步拉高了其配套硬件的投资成本。ChatGPT需要大量的计算资源和能源,它需要高端的硬件设备来支持运行,而高端设备的采购成本非常高昂,给企业和组织带来了巨大的财务压力。根据目前市场上先进处理器的采购选择,支持每秒运行10万次查询的GPT-4处理系统的采购成本高达数千亿美元,而运行该系统的能源年成本将在数亿美元左右。cUIesmc
显然,高昂的成本是大规模部署ChatGPT创新技术的障碍。cUIesmc
不过,这也为半导体行业的发展提供了机遇,通过提供支持性的硬件,可推动生成式AI大语言模型的发展。这需要一个可行的解决方案来解决可用基础设施架构不足的问题:cUIesmc
总体而言,为了实现经济可持续性和节能,ChatGPT处理系统的成本效益必须提高两个数量级以上。只有把GPT-4系统上每秒运行10万次查询的年总成本从数千亿美元降低到100亿美元以下,才能实现生成式AI的承诺。cUIesmc
本文翻译自国际电子商情姊妹平台EETimes Europa,原文标题:The Promise and Reality of Generative AIcUIesmc
微信扫一扫,一键转发
关注“国际电子商情” 微信公众号
国际电子商情3日讯 高通在当地时间周三公布本季不温不热的销售预测后,尾盘下跌高达8.2%。鉴于当前智能手机需求疲软,这家智能手机处理器制造商正在采取措施减少开支,并计划裁员。
由于半导体需求不足的缓和,即便汽车销量增加,但民用电子设备的购买欲望不足,仍导致以智能手机和PC为中心的元器件需求下滑。
国际电子商情2日讯 据外媒报道,由于存在潜在的安全隐患,美国汽车安全监管机构周二表示已对28万辆新款特斯拉Model 3和Model Y车辆展开调查。
据外媒报道,软银集团旗下半导体公司Arm计划最早在9月份IPO,估值在600亿至700亿美元之间...
尽管美国制造业仍处于收缩区域,但7月制造业指数出现小幅改善,可能预示该行业终于触底。美国供应管理协会ISM录得7月PMI增长0.4%,达到46.4。制造商继续调整生产和就业水平,以适应连续11个月疲软的需求。
近年来,作为第三代半导体材料的碳化硅(SiC)和氮化镓(GaN)取得了长足发展,而氧化镓有望实现更高的击穿电压和更低的功率损耗,因而备受期待。
国际电子商情2日讯 近日,SEMI公布了2023年第二季全球硅片出货量情况,报告显示,2023年第二季度全球硅晶圆出货量环比增长2%,达到33.31亿平方英寸,较去年同期的37.04亿平方英寸下降10.1%。硅晶圆出货量在2022年第三季度之后持续下滑,但在今年第二季度出现反弹。
国际电子商情1日讯 中国商务部、海关总署、国家国防科工局、中央军委装备发展部发布关于对无人机相关物项实施出口管制的公告,根据《中华人民共和国出口管制法》《中华人民共和国对外贸易法》《中华人民共和国海关法》有关规定,为维护国家安全和利益,经国务院、中央军委批准,决定对特定无人驾驶航空飞行器或无人驾驶飞艇相关物项实施出口管制。公告自2023年9月1日起正式实施。
安森美已于美国东部时2023年7月31日上午9时举行了电话会议,在这次电话会议上,安森美讨论了2023年第2季度及全年业绩。根据安森美最新季度财务数据显示,其Q2主要受益于汽车和工业终端市场驱动增长,两大业务为该公司贡献了80%的收入。
在这类问题中,分销商所扮演的角色至关重要,尤其是对于在已经达到EOL(项目终止或停产) 并面临过时挑战的零部件而言。对半导体器件需求的增加,将加速特定规格器件的淘汰。
国际电子商情31日讯 近日意法半导体公布2023年第二季度财务业绩。数据显示,意法半导体第二季度净收入43.3亿美元,同比增长12.7%,毛利率49%,营业利润率26.5%,净利润10亿美元;上半年净收入85.7亿美元,同比增长16.1%,毛利率49.3%,净利润20.5亿美元。
中企赴印投资建厂的热潮似乎有所放缓……
据TrendForce集邦咨询研究显示,2023年第二季高刷新率面板(100Hz(含)以上)出货量激增,季成长幅度高达62%,出货量高达
8月1日,英国Micro LED材料技术厂商Kubos宣布,公司获得由英国政府创新机构Innovate UK颁发的70万英镑(约合人民
据MarketWatch消息,近期AMD宣布将在未来5年内投资约4亿美元在印度扩张。
中国新能源汽车(EV)的崛起正在重塑全球汽车行业,挑战着传统汽车制造商。
“深圳卫视深视新闻”消息,7月29日英特尔大湾区科技创新中心在深圳正式启动运营,并与深圳前海深蕾半导体、芯
据CINNOResearch统计数据显示,2023年1-6月中国新能源项目投资金额高达5.2万亿人民币(含台湾),新能源产业已经成
消费电子市场疲软的大环境下,车用芯片市场成为独特风景线,吸引厂商持续投资,助力未来产业成长。
新冠疫情和俄乌冲突的余波,以及随后对全球经济的负面影响,仍然是目前影响汽车产量的主要因素。
据外媒报道,供应链消息显示,在生成式人工智能需求高涨以及国际形势变化等因素影响下,英伟达专供中国市场的A800
据TrendForce集邦咨询研究显示,7月中国动力电池价格保持平稳,车用方形三元电芯、铁锂电芯和软包型三元动力电
8月1日,村田制作所宣布,旗下位于菲律宾的子公司Philippine Manufacturing Co. of Murata, Inc.已于2023年8月
不久前,路透社的一篇文章提到硅谷初创公司zGlue出售了其chiplet技术专利。
2006年,世界银行发布的第8号文件估计,全球每年的无收益水成本高达140亿美元。智能水务管理的市场非常广阔……
作为一场全球性的高精尖科技盛会,中国国际高新技术成果交易会成为洞察全球市场新需求、行业发展新趋势、人才
半导体是高技术壁垒、重资产和低回报的行业,显著的特点是产业链在全世界分布。
9月5日-6日, 2023 | 海南·海口
Arm 和我们的生态系统的关键信念之一是与开源社区合作,共创一个高度发达的 Arm 架构,使软件的落地更加稳定
航顺芯片经过多年发展后为更快速的人才集聚和弥补核心技术商业化,采取先投资,双方团队磨合后并购32位MCU研发
通过替换现有的Si MOSFET,可将器件体积减少约99%,功率损耗减少约55%
2023年7月20日,B2B电子元器件交易平台ICZOOM Group Inc.(纳斯达克股票代码:IZM)(“公司”或“ICZ
2023年7月15日顶讯科技华东区用户见面会圆满收官,感谢华东区客户朋友们对易宝软件的信任和给予顶讯团队的鼎
8月23日-24日, 2023 | 四川·广汉
1979年,在祖国万里疆土的华南沿海,一个小渔村——深圳成为了全国目光的焦点,中国经济自此逐渐开始
7月11日~13日,国家会展中心(上海),业内领先的电子元器件独立分销商深圳创实技术有限公司(简称“创实技术”或“Cy
点击查看更多
北京科能广告有限公司深圳分公司 版权所有
分享到微信
分享到微博
分享到QQ空间
推荐使用浏览器内置分享
分享至朋友圈