来源:人民日报
原标题:中国算力网青年攻关团队——
攻坚
将算力链路编织成网
周一清晨,广东深圳西丽湖畔,鹏城实验室石壁龙园区实验室里,阵阵键盘敲击声与低语交谈声交织,新一天的忙碌已然开启。鹏城实验室研究员余老师准时来到实验室。刚刚过去的周末,他经历了一次“特种兵式”的出差,辗转芜湖、苏州、上海,周日深夜才飞回深圳。
尽管才38岁,余老师却已经是团队的“老同志”了。团队共有156人,大多是刚走出校园不久的博士或博士后,35岁以下青年占比82%。就是这样一支年轻的队伍,正在攻关一个名为“中国算力网”的研究计划。
“让用算力像用电一样方便。”这是中国工程院院士、鹏城实验室主任高文对“中国算力网”建设提出的愿景。简单来说,“中国算力网”就是要把分散在全国的成规模算力中心联结起来,形成更高效的算力服务模式。未来,无论是训练大模型还是处理复杂计算,用户使用算力,能像用水用电一样随取随用。
愿景宏大,前路却如在无人区跋涉,布满未知与挑战。余老师介绍,要实现全国大型智算中心、超算中心、数据中心等异构算力资源互联互通,须攻克通信、网络、计算相融合的全链条技术难题——不仅技术边界模糊,也没有现成经验可循,每一步都需要自己摸索。
为了实现技术攻关目标,鹏城实验室从各个研究线上抽调人选组建团队,涉及光纤通信、网络、系统、软件以及人工智能等多个领域,人数从最初的10余人发展壮大至上百人。“面对交叉学科,年轻是一种优势。年轻人思路活跃、想法新颖,更容易产生火花。”2020年底加入鹏城实验室的助理研究员张老师说。
截至目前,团队成功攻克了超大容量光通信、算网原生新型网络、异构智能算力集群系统等关键核心技术,可建立千公里的超大带宽网络通道,实现对各类计算中心的云化整合,为构建全国一体化算力网络提供关键技术支撑。
针对国产芯片计算性能受限等挑战,在省市各部门的大力支持下,团队历时9个月高负荷研发,完成首个全国产E级(每秒百亿亿次运算)人工智能算力平台“鹏城云脑Ⅱ”,并突破大规模并行训练技术,填补了国产智算千亿级大模型高效率训练的技术空白。
“研发‘鹏城云脑Ⅱ’时,白天设备进场安装,晚上人员入场调试,大家分成几班接力干。”余老师和张老师感慨,“当时工作量确实大,但大家沉浸其中,反而没觉得有多辛苦。”
谈起团队里的年轻人时,他们共同提到了“使命感”3个字。张老师说,来实验室面试的年轻人,问得最多的不是“能发多少论文”“待遇如何”,而是“这件事情有没有意义”。他们真是想做点对国家有用的事情,中国算力网恰好给了他们实现理想的平台。
使命感不仅体现在实验室的科研攻关里,也延伸到了全国各地的算力节点上。作为一项系统性研究计划,中国算力网不仅要聚焦算力网核心难题全力攻坚,在实验室里找突破,团队也要常年穿梭于全国各地算力节点之间,去掌握算力使用情况,精准捕捉并高效对接各类网络通信需求,推动算力上网,为研究计划的落地筑牢实践根基。算力网建设之初,很多人对此并不了解,对算力上网的安全性与可靠性也存在疑虑,需要团队反复讲解沟通。
如今,中国算力网已跨地域接入40余个异构算力集群,覆盖了全国20余座城市,一条条算力链路如同跃动的血脉,纵横交错、相互贯通,正逐步编织成一张遍布全国主要区域的算力服务网络,为国家数字经济发展注入源源不断的动力。