同时,伴随人工智能普惠时代到来的,还有推理算力需求的水涨船高。
全球推理算力需求提升 算力供应用商抢滩登陆
随着DeepSeek R1等推理大模型深度渗透到生产办公、生活服务、行业赋能等更多场景,AI领域的竞争焦点正发生深刻转变,曾席卷AI领域的训练模型军备竞赛浪潮正逐步褪去,行业竞争焦点开始向推理优化、场景落地等方向深度转移。Gartner预测,2028 年全球推理算力需求与训练算力需求之比将飙升至 3∶1,其中中国市场该差距更是有望突破 4∶1,展现出强劲的发展态势。
在推理算力需求快速增长的背景下,国内外服务商加速全球算力基础设施与生态合作布局,谁能接住这“泼天的富贵”?
国内外多家云算力服务商陆续开展或早已在全球重点区域进行算力基础设施布局,开启“圈地”模式。云服务商方面,阿里云在韩国、泰国等 5 国新建数据中心,重点布局 AI 基础设施;腾讯云积极拓展海外市场,在东南亚、中东等地区加强布局;华为云布局北非节点覆盖埃及及中西非。国外服务商像亚马逊云科技宣布将在泰国、沙特阿拉伯、墨西哥等地建立数据中心;微软云也于2024年宣布在印度尼西亚、马来西亚等国家进行投资。
与众云服务商重投入建设不同的是,云网服务商采用了与云服务商、IDC厂商开展生态合作的模式,向企业提供算力租赁服务,快速承接市场需求。比较具有代表性的厂商,像南凌科技与VMware合作,部署边缘计算服务;天维信通CBC与数据中心运营商 Global Switch合作适配AI算力需求;第一线DYXnet基于自身网络架构,融合其母公司世纪互联AIDC与自建OCD边缘云资源,以及合作火山引擎、阿里云、华为云等国内外公有云与IDC厂商,构建全球云、边、端的算力服务资源池,并基于此提供AI MaaS服务,帮助企业部署私域大模型。
总之,在推理算力需求爆发的当下,全球服务商正以差异化策略竞逐:云服务商通过重资产投入加速全球算力基建版图扩张,夯实节点覆盖的 “硬实力”;云网服务商则以生态合作为引擎,编织多云协同、边缘整合的算力资源 “弹性网”。两条路线虽侧重不同,却共同指向算力服务的全球化布局。然而,随着 AI 向智能体演进催生指数级需求跃迁,能否在既有路径中培育动态适配能力,正成为服务商接住未来机遇的核心变量。
“要致富先修路” 网络架构升级变革
根据Artificial Analysis统计,在模型扩展律(Scaling Law)主导的初期阶段,增大模型参数带来了约5倍的算力提升。进入模型后训练与推理为主导的阶段后,模型输出的 Token数量显著增加,推动算力需求再增长约10倍。而步入Agent时代,算力需求激增的驱动力转变为单Agent处理单任务所需的请求次数,这一数量级预计提升约20倍。这些因素叠加最终将导致整体推理算力需求呈现数十倍甚至上百倍的跃升。
同时,随着MCP、A2A、Kafka协议栈的落地发展,AI Agent之间的频繁交互,也将进一步对算力与网络的协同提出要求。例如AI大模型训练需在多节点服务器间传输海量参数(如万亿级参数模型单次迭代的数据量可达 TB 级),而 AI Agent 运行时需实时处理多模态输入(如图像、视频、传感器数据)和跨Agent通信数据。这一趋势倒逼网络从 “数据传输管道” 向 “算力协同基础设施” 转型。网络需在带宽、延迟、可靠性、架构等层面全面升级,与算力资源形成 “传输-计算-存储” 的一体化闭环。
在算力需求与网络协同要求持续攀升的背景下,如何破局成为关键,而我国已开始着手算力互联网的建设落地。随着我国八大算力节点建设稳步推进,成果初显,今年5月工业和信息化部更是发布《算力互联互通行动计划》,致力利用此工程化创新,实现跨主体、跨架构、多地域算力供需调度,承载人工智能、科学计算、智能制造等企业级场景高质量发展。
同时,众多服务商也在积极探索网络与算力的协同路径,为AI Agent时代的应用场景搭建基础设施。据悉,阿里云通过内蒙古枢纽节点和林格尔数据中心集群提供智能算力,构建混合云网络;第一线DYXnet联合华为等伙伴构建 AI 原生超互联架构,实现城域内全类型算力主体(含AIDC、公有云算力、边缘算力及园区、楼宇、企业、个人、大模型等),经就近节点高速安全接入总线架构实现互联,形成契合自身需求的私域计算空间,以此承载大模型训推,以及驱动专属AI Agent协同赋能。
第一线总经理陈姵妏也表示:随着中国企业走向全球,其数智化基础设施服务也需同步出海。第一线计划将其AI原生超互联架构的创新模式拓展至海外市场,构建覆盖国内外AIDC、公有云、边缘云的全球化算力网络。而据了解,第一线成立25年,在全球范围内已与中国三大运营商,以及法国电信、德国电信、日本软银、西班牙电信等运营商保持合作,网络服务能力覆盖全球700+城市,包括中国大陆、中国香港、中国台湾、东南亚、中东、拉美等多地区,这为其实现网络模式创新落地形成了先天基础。
AI 大模型重构商业生态背景下,算力需求与网络协同成核心命题。业界实践显示,算力基建需兼顾全球化布局与弹性调度能力,网络架构正从传输工具向算力协同枢纽转型。未来竞争焦点或在于动态适配 AI Agent 时代的算力网络一体化能力。