全球超算“华山论剑”：超智融合迎来中国方案

（文/陈济深编辑/张广凯）

6月24日，德国汉堡，第41届ISC High Performance 2026如期举行。作为全球高性能计算领域最重要的年度会议，ISC每年都是超算产业的风向标：TOP500、IO500等权威榜单在这里发布，全球超算中心、芯片厂商、系统厂商和应用团队在这里展示各自对下一代算力的理解。

但今年的比拼，已经不再只是“谁算得最快”。

随着AI for Science和大模型训练成为高性能计算的新主线，全球超算产业正在从峰值性能竞争转向系统能力竞争。单颗芯片再强，如果数据供不上、网络调不动、能耗压不住、应用跑不稳，最终都难以转化为真实生产力。AI时代的算力竞争，正在从“算力有多大”走向“有效算力有多少”。

AI与高性能计算深度融合，全球超算竞争正从峰值性能转向系统能力

行业对这种转变有一个概括：超智融合。正是围绕这条主线，中国厂商在本届ISC上交出了一份超出榜单排名本身的成绩单。

不止一张榜单的事

在榜单层面，本届ISC传递了两个信号。深圳灵晟超级计算机拿下TOP500第一，中国超算时隔多年重返国际超算榜首。与此同时，中科曙光ParaStor全闪存储拿下IO500生产型全节点和10节点两项第一，成为首个在该权威榜单生产型评测上双料登顶的中国厂商。

如果说TOP500代表的是峰值算力的国家竞争，IO500生产型榜单考核的则是另一件事：真实业务环境下的长期运行能力和复杂负载承载能力。过去，这一领域长期由国际厂商主导。此次登顶，意味着国产高端存储在全球权威评测中补上了关键一环。

但这两张榜单真正值得放在一起读的原因在于：它们恰好对应了超智融合的两个面——算力的绝对规模，以及支撑这种规模持续运转的系统能力。后者长期被低估，如今却成了决定有效算力的关键变量。

超智融合，到底在融什么

大模型训练进入PB级数据吞吐阶段后，算力集群的短板已不只出现在芯片端。训练样本读取、多模态数据调用、checkpoint保存与恢复、跨节点任务调度，都对存储系统提出极高要求。数据一旦供不上，GPU和NPU就可能空转；存储系统一旦不稳定，训练任务就可能中断。对于万卡级、十万卡级集群来说，存储不再是后台配套，而是有效算力的生死线。

正因如此，超智融合才被推到舞台中央。它不是把传统超算和智能计算简单放在一起，而是把传统超算擅长的大规模并行计算和高精度科学计算能力，与智算擅长的模型训练、推理和数据驱动能力，在统一架构下重新组织。它考验的不是某个环节能跑多快，而是计算、存储、网络、能源、软件调度和应用生态能不能协同起来、一起跑稳。

这种协同已经在真实场景中接受了检验。在具身智能训练中，国产存储系统为机器人训练提供超过500GB/s的聚合读带宽，支撑多模态数据的高速调用；在AI for Science场景中，依托国产超集群与存储系统的协同，联合软件方完成414.7亿原子规模的液态水分子动力学模拟，刷新相关世界纪录。无论是机器人训练还是大规模科学计算，考验的都是同一件事：算、存、网、软能不能作为一个整体运转。

从这个角度看，中国存储此次在IO500上登顶，与其说是一个产品的胜出，不如说是对中国超智融合能力的一次国际验证，并且是在最容易被忽视的环节上，证明了系统级的成熟度。

下半场的胜负手变了

这种变化折射出的不只是一两家厂商的进步，而是全球超算产业的共同转向。

多位国内超算和信息化领域的专家对观察者网表示，衡量超算的核心尺度正在发生根本转变：从“追求峰值FLOPS”转向“每一瓦电力能产出多少Token”。在他们看来，超智融合是超级计算发展史上的一道分水岭：超算正从服务少数前沿科学任务的封闭平台，转变为支撑全产业的开放式基础设施。

但门槛同样很高。超智融合要求同时做强传统超算和智能计算两套能力，是对底层硬件、系统架构、软件生态和工程能力的综合考验。放眼全球，真正有能力把高强度CPU系统和GPU、NPU系统融合起来的国家并不多。而更难的问题在于产业落地：数据、模型、算法和算力能否打通成一个整体，决定了超智融合能否从技术概念走向生产力转化。这仍然是一道全球性的未解题。

本届ISC上，中国厂商从芯片自研、液冷工程到融合架构，各自给出了不同路径的回应。过去，超算比的是谁算得最快；如今，胜负手变成了系统效率、工程能力和产业适配。谁能把算力、数据、能源和应用更高效地组织起来，谁就更有可能在下一阶段的竞争中占据主动。中国厂商此次的表现，至少说明一件事：在超智融合这条新赛道上，中国方案已经具备了参与系统级竞争的入场资格。