随着人工智能应用的广泛扩展,训练和部署这些复杂模型所需的计算力也在急剧上升。这一趋势使得数据中心的资本支出(CapEx)和运营支出(OpEx)持续上升,而数据中心正是支撑这场数字革命的关键基石。
人工智能(AI)已成为推动全球技术变革的核心力量,它在医疗、金融、汽车和娱乐等多个领域展现出巨大的发展潜力。但随着人工智能应用的广泛扩展,训练和部署这些复杂模型所需的计算力也在急剧上升。这一趋势使得数据中心的资本支出(CapEx)和运营支出(OpEx)持续上升,而数据中心正是支撑这场数字革命的关键基石。O6sesmc
面对成本不断上升的挑战,众多数据中心业主采纳了一种策略,即通过人工智能训练设备的摊销来分摊推理阶段的成本,例如,部署已经训练完毕的人工智能模型。尽管这种做法在短期内看似能够减轻企业财务压力,实则潜藏风险,可能会对数据中心的财务健康和运营效率造成不利影响。为了推动人工智能的持续健康发展,我们必须调整策略——力求在平衡资本投入与运营支出的同时,保障设备的长期稳定性和高效运行。O6sesmc
将人工智能训练硬件的成本在其预计使用周期内进行摊销的做法相对直接。鉴于人工智能训练对计算资源的高需求,高端GPU和加速器的购置成本可能高达数百万美元。数据中心业主通过将这些高昂成本分摊至数年,试图为这一巨额投资提供合理性,并确保高端训练设备在经济上具有可行性。O6sesmc
这些昂贵的硬件在完成训练任务后并不会闲置,它们通常会在训练阶段结束后转而用于推理工作。这种做法的思路是,如果数据中心能够利用同一套硬件既进行训练又进行推理,那么由此产生的总收入将有助于抵消最初的设备投资和持续的电力消耗。从理论上看,这一逻辑是成立的:将投资成本分摊到多种运营活动中,可以减轻财务指标的压力,从而可能提升盈利水平。O6sesmc
然而,现实情况远比理论复杂。依赖人工智能训练设备进行推理的做法,给数据中心带来了不容忽视的限制,如今这些问题已无法再被忽略。O6sesmc
尽管训练设备是一项关键的资本投入,但在数据中心中,电力消耗才是运营成本的主要组成部分,尤其是在训练和推理过程中。高性能GPU和加速器在运行时产生大量热量,需要强大的冷却系统来维持,这不仅导致电费激增,还给电力设施带来压力。即使采用了尖端的冷却技术和节能措施,大规模运行人工智能的电力需求依旧难以有效控制。O6sesmc
当数据中心使用高功率训练设备执行长时间的推理任务时,问题愈发明显。与通常为突发性且可能间歇性进行的训练不同,推理任务是持续性的,因为模型需要处理实时数据流。持续的工作负载意味着,这些高容量系统需要长时间接近满负荷运行,从而导致运营成本远超预期。O6sesmc
在硬件处理领域,延迟是一个常被忽略却具有重大影响的因素。延迟指的是从发起查询到获得响应之间的时间间隔。在机器学习的训练阶段,延迟一般是可以容忍的,但在推理阶段,情况则完全不同。在这个环节中,即便是微小的延迟也可能引发连锁反应。如果响应时间超过几秒钟,就可能导致用户参与度下降,损害用户体验,并违背实时处理的目的。O6sesmc
为了克服延迟问题,工程师可能会考虑增加处理器数量以实现并行处理,从而提升整体处理能力。乍看之下,这种方法似乎行之有效;毕竟,增加处理器能直接提升处理速度。但实际上,这个问题远比想象中复杂。增加处理器确实能够提高性能,但这背后的代价也是巨大的:数据中心运营方的资本支出和运营支出将会急剧增加。扩充硬件资源如同添柴加火,虽然可能暂时缓解延迟问题,但也可能引发成本急剧增加,以至于难以持续的程度。O6sesmc
成本的增加不仅体现在初期的投资上,还会导致日常运营预算的上升,进而增加电力消耗、维护成本和资源管理的需求。对于众多企业而言,这种做法可能会变成一项沉重的运营负担,其带来的负面影响可能超过了减少延迟所带来的收益。面对这一挑战,企业需要采纳更为高效和可持续的策略来解决延迟问题,比如通过专门的硬件优化、更智能的数据处理架构,或是利用那些能简化实时响应又不会超出预算的技术手段。O6sesmc
当前摊销策略的一个主要问题在于,它预设了人工智能训练设备在转为推理任务使用时,能够持续足够长的时间来完成全部折旧。尽管这些设备确实具备强大的处理能力,但长时间连续使用所造成的磨损和损耗可能会非常严重。O6sesmc
训练阶段被极限使用的人工智能硬件,在持续执行推理任务时的耐用性可能不如预期。一个不容忽视的现实是,许多数据中心可能不得不在这些系统完成折旧之前就进行更换,这不仅会导致资本提前注销,还会带来额外的财务负担。O6sesmc
面对这些挑战,行业必须探索可持续的解决之道,在资本支出与运营支出之间寻求平衡,确保对人工智能基础设施的投资不仅在短期内合理,长远来看也能保持耐用与高效。此时,那些着眼于长期稳定性和能源效率的创新设计便显得尤为重要。O6sesmc
一种可能的解决方案源自一个看起来与数据中心并不相关的行业:汽车产业。汽车级技术长期以来致力于打造耐用、性能稳定且高能源效率的产品。不同于传统数据中心硬件,汽车级系统被设计成能够抵御恶劣环境和长期连续运行的考验,且其性能不会明显衰退。这种坚韧特性意味着更长的使用寿命和降低的更换频次,这在考虑设备摊销时成为一个至关重要的优势。O6sesmc
一家最初服务于汽车行业的创新企业,开发了一项技术,可能会重塑数据中心在人工智能策略上的制定方式。该技术采用为汽车行业量身定制的严格质量和耐用性标准,汽车级解决方案因此具备了与数据中心需求高度匹配的多个优势。O6sesmc
首先,这些系统在设计上注重低功耗。与许多高功耗的高端GPU和人工智能加速器不同,这项技术在保持卓越性能的同时,优先考虑了能源效率。这有效解决了在大量运行人工智能模型时电力消耗所带来的主要运营成本问题,从而显著降低了整体的运营成本。O6sesmc
其次,这类解决方案相较于传统人工智能训练硬件,拥有更长的使用寿命。采用汽车级耐用性的设备能够抵御持续使用的严苛环境,不易像传统数据中心硬件那样出现早期磨损和损坏。这意味着更长的折旧周期和减少了对新硬件的资本投入,从而有效减轻了数据中心运营商的财务压力。O6sesmc
人工智能的发展势头不减,支撑其成长的数据中心需求也在不断上升。目前,将昂贵的训练设备转用于推理任务以分摊成本的策略,正日益显露出其短视性,该策略未能充分考虑电力消耗和硬件寿命的实际影响。为避免财务和运营上的不可持续压力,必须对战略进行调整。O6sesmc
将汽车级技术解决方案融入人工智能基础设施规划之中,能够带来迫切需要的改善。虽然这些系统可能需要在初期重新调整预算以应对较高的资本支出,但其长期好处——降低能耗、延长设备使用寿命,以及更为合理的摊销安排——将远超初始的投资成本。O6sesmc
在数据中心不断推动人工智能革命的过程中,行业领导者们必须重新审视策略,以应对AI规模化带来的隐性成本。目前,将训练设备成本通过在推理阶段的共用进行摊销的做法,忽视了关键的运营成本挑战和硬件使用寿命的实际问题。O6sesmc
通过采纳注重效率和持久性的解决方案,数据中心能够为人工智能的未来构建一个更加可持续、更具成本效益的基石。未来的发展路径,不仅要求在AI模型上推陈出新,也要求在支撑AI运行的基础设施上进行创新。O6sesmc
本文翻译自国际电子商情姊妹平台EETimes,原文标题:Hidden Cost of AI: Why Data Center Strategies Need a RethinkO6sesmc
微信扫一扫,一键转发
关注“国际电子商情” 微信公众号
国际电子商情讯,3月17日晚间,深圳英集芯科技股份有限公司发布公告称,公司决定终止购买辉芒微电子(深圳)股份有限公司控制权,公司芯股票自2025年3月18日开市起复牌。
全球前十大IC设计公司全年营收合计达2498亿美元,同比激增49%。其中,英伟达以1243亿美元营收蝉联榜首,占据前十总份额的50%,与其他厂商形成断层式差距。
继宝马、奔驰裁员之后,奥迪也开始宣布裁员。
最近,国产存储领域出现了一个新进者——思远半导体。这家在智能穿戴、TWS耳机、移动电源、BMS等领域深耕十数年的电源管理芯片(PMIC)Fabless,如今把业务范围成功地扩展到了存储电源领域。
3月17日午间,华大九天发布公告称,正在筹划通过发行股份及支付现金等方式,购买芯和半导体的控股权,其股票自当日开市时起开始停牌,预计在不超过10个交易日的时间内披露本次交易方案。
近日,国家互联网信息办公室、工业和信息化部、公安部、国家广播电视总局联合发布《人工智能生成合成内容标识办法》(以下简称《标识办法》),该办法自 2025年9月1日起正式施行。
日前,美国国会众议院以口头表决的方式一致通过了编号H.R.1166的《与依赖外国对手电池脱钩法》,禁止美国国土安全部采购宁德时代、比亚迪、远景能源、亿纬锂能、海辰储能和国轩高科六家中国企业生产的电池。
2025年3月16日,中共中央办公厅、国务院办公厅印发《提振消费专项行动方案》并发出通知。其中涉及到“人工智能+”行动,促进“人工智能+消费”。
国际电子商情讯,据彭博社资深记者马克·古尔曼(Mark Gurman)最新爆料,苹果正秘密打造一款颠覆性产品——iPhone 17 Air,该机型将以“史上最薄iPhone”姿态冲击市场,该机型将无SIM卡槽,机身厚度仅5.5毫米,较现有iPhone薄约2毫米。
"以后只有用我们的鸿蒙PC了。”
国际电子商情讯,继闪迪、美光宣布涨价之后,业内也传出长江存储也将涨价。根据中国闪存市场报道,根据渠道反馈,长江存储零售品牌致态也将于4月起面向渠道上调提货价格,幅度或将超过10%。
“全国人民买得起、想不到的产品”
美通社消息,3月14日,“2025英飞凌消费、计算与通讯创新大会”(ICIC2025)在深圳举行。本届大会汇聚600多位业界精
近日,湖南省工信厅发布了《2025年湖南电子信息制造业重点项目名单》,涵盖先进计算、音视频、新一代半导体、人
3月15日,质鼎集团公众号消息,惠科东莞平板显示集群电子商务项目二期正式开工。
富士康、台积电、广达、华硕、联发科、友达光电等中国台湾20家电子企业2024年第四季度和全年财报汇总。
近年来,LED显示屏市场持续演进。回顾2024年,行业呈现出哪些发展态势?展望2025年及未来,市场又将面临哪些机遇与
近日,索尼正式发布新一代RGBLED背光技术系统,可实现4000尼特峰值亮度。索尼计划该系统将于2025年开始量产,并将
AI芯片是半导体最大的增长点,先进封装则是制造AI芯片的关键技术。此前英伟达H100成本约3000美元,而用先进封装
截止2024年底,17家欧美固态电池企业融资总额已突破42亿美元。
曾几何时,中国半导体几乎不断有大基金投资、大项目上马,以及美国制裁的新闻。长期处于聚光灯下,中国半导体成为
Dynabook在退出十年后宣布重返美国消费市场。
Canalys最新数据显示,受到消费需求激增8%的推动,2024年第四季度中国大陆的PC市场开始复苏,同比增长2%。
根据TrendForce集邦咨询最新调查,2024年第四季由于Apple(苹果)手机生产进入高峰,以及中国部分地方提供消费补贴
德州仪器近日推出了全球超小型 MCU,进一步扩展了品类齐全的 Arm® Cortex®-M0+ MSPM0 MCU 产品组合。
创新是企业持续发展最大的价值。
“闪迪(Sandisk)又回来了!”在3月12日的存储年度盛会CFMS MemoryS 2025上,闪迪公司全球产品副总裁Eric Spa
摩尔斯微电子推出合规的Wi-Fi HaLow片上系统(Soc),开启欧洲连接技术新纪元。超低功耗、远距离连接功能现已为
CFMS | MemoryS 2025已圆满落幕,期间包括三星电子、长江存储、铠侠、美光、闪迪、高通、Arm、慧荣科技、S
Hyperlux™ ID iToF 系列将深度测量距离提升至最远 30 米,提高工业环境中的生产效率和安全性
26TB大容量CMR HDD助力WD Red Pro与G-DRIVE/G-RAID系列专业级产品矩阵,赋能数据存储拓展与生产力跃升
全新一代MCU可以满足各种区域控制架构和电气化系统需求,助力汽车制造商向软件定义汽车(SDV)过渡。
将出色的高
聚洵半导体科技(上海)有限公司(Gainsil Semiconductor Technology)于2016年成立于上海张江科学城,是一家全球
领域新成果领域新成果4月必逛电子展!AI、人形机器人、低空飞行、汽车、新能源、半导体六大热门新赛道,来NEPCO
后量子加密技术帮助保护数字基础设施免受量子计算机在将来带来的潜在威胁。
英飞凌坚信低碳化和数字化是未来十年的关键驱动力,半导体在应对能源挑战和推动数字化转型中扮演着重要角色。
点击查看更多
北京科能广告有限公司深圳分公司 版权所有
分享到微信
分享到微博
分享到QQ空间
推荐使用浏览器内置分享
分享至朋友圈