(文/陈济深 编辑/张广凯)

6月24日,德国汉堡,第41届ISC High Performance 2026如期举行。作为全球高性能计算领域最重要的年度会议,ISC每年都是超算产业的风向标:TOP500、IO500等权威榜单在这里发布,全球超算中心、芯片厂商、系统厂商和应用团队在这里展示各自对下一代算力的理解。

但今年的比拼,已经不再只是“谁算得最快”。

随着AI for Science和大模型训练成为高性能计算的新主线,全球超算产业正在从峰值性能竞争转向系统能力竞争。单颗芯片再强,如果数据供不上、网络调不动、能耗压不住、应用跑不稳,最终都难以转化为真实生产力。AI时代的算力竞争,正在从“算力有多大”走向“有效算力有多少”。

AI与高性能计算深度融合,全球超算竞争正从峰值性能转向系统能力

行业对这种转变有一个概括:超智融合。正是围绕这条主线,中国厂商在本届ISC上交出了一份超出榜单排名本身的成绩单。

不止一张榜单的事

在榜单层面,本届ISC传递了两个信号。深圳灵晟超级计算机拿下TOP500第一,中国超算时隔多年重返国际超算榜首。与此同时,中科曙光ParaStor全闪存储拿下IO500生产型全节点和10节点两项第一,成为首个在该权威榜单生产型评测上双料登顶的中国厂商。

如果说TOP500代表的是峰值算力的国家竞争,IO500生产型榜单考核的则是另一件事:真实业务环境下的长期运行能力和复杂负载承载能力。过去,这一领域长期由国际厂商主导。此次登顶,意味着国产高端存储在全球权威评测中补上了关键一环。

但这两张榜单真正值得放在一起读的原因在于:它们恰好对应了超智融合的两个面——算力的绝对规模,以及支撑这种规模持续运转的系统能力。后者长期被低估,如今却成了决定有效算力的关键变量。

超智融合,到底在融什么

大模型训练进入PB级数据吞吐阶段后,算力集群的短板已不只出现在芯片端。训练样本读取、多模态数据调用、checkpoint保存与恢复、跨节点任务调度,都对存储系统提出极高要求。数据一旦供不上,GPU和NPU就可能空转;存储系统一旦不稳定,训练任务就可能中断。对于万卡级、十万卡级集群来说,存储不再是后台配套,而是有效算力的生死线。

正因如此,超智融合才被推到舞台中央。它不是把传统超算和智能计算简单放在一起,而是把传统超算擅长的大规模并行计算和高精度科学计算能力,与智算擅长的模型训练、推理和数据驱动能力,在统一架构下重新组织。它考验的不是某个环节能跑多快,而是计算、存储、网络、能源、软件调度和应用生态能不能协同起来、一起跑稳。

这种协同已经在真实场景中接受了检验。在具身智能训练中,国产存储系统为机器人训练提供超过500GB/s的聚合读带宽,支撑多模态数据的高速调用;在AI for Science场景中,依托国产超集群与存储系统的协同,联合软件方完成414.7亿原子规模的液态水分子动力学模拟,刷新相关世界纪录。无论是机器人训练还是大规模科学计算,考验的都是同一件事:算、存、网、软能不能作为一个整体运转。

从这个角度看,中国存储此次在IO500上登顶,与其说是一个产品的胜出,不如说是对中国超智融合能力的一次国际验证,并且是在最容易被忽视的环节上,证明了系统级的成熟度。

下半场的胜负手变了

这种变化折射出的不只是一两家厂商的进步,而是全球超算产业的共同转向。

多位国内超算和信息化领域的专家对观察者网表示,衡量超算的核心尺度正在发生根本转变:从“追求峰值FLOPS”转向“每一瓦电力能产出多少Token”。在他们看来,超智融合是超级计算发展史上的一道分水岭:超算正从服务少数前沿科学任务的封闭平台,转变为支撑全产业的开放式基础设施。

但门槛同样很高。超智融合要求同时做强传统超算和智能计算两套能力,是对底层硬件、系统架构、软件生态和工程能力的综合考验。放眼全球,真正有能力把高强度CPU系统和GPU、NPU系统融合起来的国家并不多。而更难的问题在于产业落地:数据、模型、算法和算力能否打通成一个整体,决定了超智融合能否从技术概念走向生产力转化。这仍然是一道全球性的未解题。

本届ISC上,中国厂商从芯片自研、液冷工程到融合架构,各自给出了不同路径的回应。过去,超算比的是谁算得最快;如今,胜负手变成了系统效率、工程能力和产业适配。谁能把算力、数据、能源和应用更高效地组织起来,谁就更有可能在下一阶段的竞争中占据主动。中国厂商此次的表现,至少说明一件事:在超智融合这条新赛道上,中国方案已经具备了参与系统级竞争的入场资格。