广告

生成式AI大规模商用前提:提效率、降成本、降功耗……

与大多数应用程序不同,虽然ChatGPT软件正在步入正轨,但是支持运行该应用程序的硬件却并非如此。

生成式人工智能(AI)的大规模落地取决于提高处理效率和降低总拥有成本。与互联网及其万维网应用程序的发明类似,生成式人工智能已经抓住了公众的想象力。ChatGPT技术一经发布就受到了各界的广泛关注,它是迄今为止用户增长最快的应用程序,仅在问世的前两个月内,注册用户数就突破了1亿人。cUIesmc

生成式AI正取得所有行业的关注,并有望释放出无与伦比的生产力浪潮。具体来看,生成式AI的市场潜力巨大,它可助力多个领域的发展,比如,辅助药物研发,提高医生诊断准确率,提高订单预测准确率,以及帮助程序员编写高质量软件代码。预计每年将能为全球经济增加4万亿美元以上的价值。cUIesmc

生成式AI大语言模型面临的硬件挑战

与大多数应用程序不同,虽然ChatGPT软件正在步入正轨,但是支持运行该应用程序的硬件却并非如此。cUIesmc

生成式AI大语言模型所面临的硬件挑战来源于——算法使用了大量的参数来生成结果。例如,ChatGPT的前一代模型GPT-3.5需要1,750亿个参数,虽然官方暂未公布GPT-4版的参数量,但是机构预估其参数量约有1.7万亿个。对此,支持生成式AI大语言模型的AI硬件加速器必须扩展到能够处理1,750亿到近2万亿个参数的标准,才能满足每个用户的查询操作。cUIesmc

在当前的计算架构上,处理器核心和存储器之间的大量数据流,通常在计算核心外部来进行处理。这种设置会导致内存瓶颈的出现,通常它也被称为“内存墙”,会带来严重的带宽限制。cUIesmc

以上因素不仅排除了CPU计算架构,而且还排除了GPU等其他AI计算架构。以GPT-4为例,其中高端的GPU约有97%的时间处于空闲状态,这相当于大约只有3%的效率。在这样的低效率下,一个标称计算能力为1 PetaOPS(每秒一千兆/一千万亿次运算)的处理器,只能产生大约30 teraOPS(每秒一兆/一万亿次运算)的处理速度。cUIesmc

如今,这些算法在高性能计算集群上执行,每个集群需要消耗大量的能源。随之而来的问题是,执行ChatGPT-4用户查询所需的功耗已经超出极限,这导致发电厂超载和能源分配网络压力过大。cUIesmc

ChatGPT的运行成本极其高昂

ChatGPT的功耗并非阻碍其商用落地的全部因素。ChatGPT技术的快速推出,进一步拉高了其配套硬件的投资成本。ChatGPT需要大量的计算资源和能源,它需要高端的硬件设备来支持运行,而高端设备的采购成本非常高昂,给企业和组织带来了巨大的财务压力。根据目前市场上先进处理器的采购选择,支持每秒运行10万次查询的GPT-4处理系统的采购成本高达数千亿美元,而运行该系统的能源年成本将在数亿美元左右。cUIesmc

显然,高昂的成本是大规模部署ChatGPT创新技术的障碍。cUIesmc

生成式AI大规模落地需满足三大要求

不过,这也为半导体行业的发展提供了机遇,通过提供支持性的硬件,可推动生成式AI大语言模型的发展。这需要一个可行的解决方案来解决可用基础设施架构不足的问题:cUIesmc

  • 将处理效率从2%至4%提高到至少50%。标称计算能力为1 PetaOPS的AI处理器,必须在现实工作负载下提供至少500 TeraOPS的处理速度。
  • 降低硬件成本。一个“有效的”而非“理论上的”计算能力为1 PetaOPS的AI处理器的成本不得超过1万美元。
  • 更低的功耗。一个“有效的”而非“理论上的”计算能力为1 PetaOPS的AI处理器的功耗必须不超过100W。

总体而言,为了实现经济可持续性和节能,ChatGPT处理系统的成本效益必须提高两个数量级以上。只有把GPT-4系统上每秒运行10万次查询的年总成本从数千亿美元降低到100亿美元以下,才能实现生成式AI的承诺。cUIesmc

本文翻译自国际电子商情姊妹平台EETimes Europa,原文标题:The Promise and Reality of Generative AIcUIesmc

责编:Clover.li
本文为国际电子商情原创文章,未经授权禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
  • 微信扫一扫,一键转发

  • 关注“国际电子商情” 微信公众号

  • 财测低于预期 高通计划裁员

    国际电子商情3日讯 高通在当地时间周三公布本季不温不热的销售预测后,尾盘下跌高达8.2%。鉴于当前智能手机需求疲软,这家智能手机处理器制造商正在采取措施减少开支,并计划裁员。

  • Q2村田各业务收入均现下滑,汽车行业收入成唯一增长点

    由于半导体需求不足的缓和,即便汽车销量增加,但民用电子设备的购买欲望不足,仍导致以智能手机和PC为中心的元器件需求下滑。

  • 外媒:美国汽车安全监管机构对28万辆Model 3/Y展开调查

    国际电子商情2日讯 据外媒报道,由于存在潜在的安全隐患,美国汽车安全监管机构周二表示已对28万辆新款特斯拉Model 3和Model Y车辆展开调查。

  • 传Arm9月赴美IPO 估值逾600亿美元

    据外媒报道,软银集团旗下半导体公司Arm计划最早在9月份IPO,估值在600亿至700亿美元之间...

  • 美国制造业低迷终于触底、即将反弹?

    尽管美国制造业仍处于收缩区域,但7月制造业指数出现小幅改善,可能预示该行业终于触底。美国供应管理协会ISM录得7月PMI增长0.4%,达到46.4。制造商继续调整生产和就业水平,以适应连续11个月疲软的需求。

  • 氧化镓技术受青睐,Novel Crystal Technology获三菱电机

    近年来,作为第三代半导体材料的碳化硅(SiC)和氮化镓(GaN)取得了长足发展,而氧化镓有望实现更高的击穿电压和更低的功率损耗,因而备受期待。

  • Q2全球硅晶圆出货量达33.31亿平方英寸,环比增长2%

    国际电子商情2日讯 近日,SEMI公布了2023年第二季全球硅片出货量情况,报告显示,2023年第二季度全球硅晶圆出货量环比增长2%,达到33.31亿平方英寸,较去年同期的37.04亿平方英寸下降10.1%。硅晶圆出货量在2022年第三季度之后持续下滑,但在今年第二季度出现反弹。

  • 9月1日起正式实施!四部门宣布对无人机和相关物项实施出

    国际电子商情1日讯 中国商务部、海关总署、国家国防科工局、中央军委装备发展部发布关于对无人机相关物项实施出口管制的公告,根据《中华人民共和国出口管制法》《中华人民共和国对外贸易法》《中华人民共和国海关法》有关规定,为维护国家安全和利益,经国务院、中央军委批准,决定对特定无人驾驶航空飞行器或无人驾驶飞艇相关物项实施出口管制。公告自2023年9月1日起正式实施。

  • 安森美2023财年Q2业绩超预期,受益于汽车和工业终端市场

    安森美已于美国东部时2023年7月31日上午9时举行了电话会议,在这次电话会议上,安森美讨论了2023年第2季度及全年业绩。根据安森美最新季度财务数据显示,其Q2主要受益于汽车和工业终端市场驱动增长,两大业务为该公司贡献了80%的收入。

  • “过时”问题或使元器件使用寿命缩短30%

    在这类问题中,分销商所扮演的角色至关重要,尤其是对于在已经达到EOL(项目终止或停产) 并面临过时挑战的零部件而言。对半导体器件需求的增加,将加速特定规格器件的淘汰。

  • 意法半导体:汽车业务营收连续四个季度增长

    国际电子商情31日讯 近日意法半导体公布2023年第二季度财务业绩。数据显示,意法半导体第二季度净收入43.3亿美元,同比增长12.7%,毛利率49%,营业利润率26.5%,净利润10亿美元;上半年净收入85.7亿美元,同比增长16.1%,毛利率49.3%,净利润20.5亿美元。

  • 继鸿海之后,传又一中企考虑取消印度建厂计划

    中企赴印投资建厂的热潮似乎有所放缓……

近期热点

广告
广告

EE直播间

更多>>

在线研讨会

更多>>