中科曙光支撑国家级算力枢纽 3套万卡超集群同时上线试运行-新华网天津

新华网天津2月6日电（记者毛振华、梁姊）国家超算互联网核心节点2月5日在郑州上线试运行。作为全国一体化算力网的算力供应方，位于天津滨海高新区的曙光信息产业股份有限公司（简称“中科曙光”）研发、生产的scaleX万卡超集群为核心节点提供算力支撑。

为核心节点提供支撑

2023年10月，国家超算互联网核心节点项目在郑州启动建设，旨在构建全球领先的国家级算力设施、调度枢纽与服务平台，有力支撑人工智能、科学研究、数字经济等多领域高质量发展。

随着项目上线试运行，核心节点部署运行的3套由中科曙光提供的scaleX万卡超集群马力全开，最大可对外提供超3万卡的国产AI算力，能够为各类AI大模型训练、高通量推理、AI for Science等大规模AI计算应用场景提供高效、安全、普惠的算力服务。

scaleX万卡超集群究竟是什么呢？它在2025年12月的光合组织人工智能创新大会上首次以真机形式亮相，这是中科曙光发挥大型计算机系统研制经验优势，面向万亿参数大模型、科学智能等复杂任务场景，打造的大规模智能算力基础设施方案。scaleX万卡超集群攻克了高速互联网络、存算传紧耦合设计、高密供电与散热、统一资源高效调度等关键技术。

超强算力展现不俗实力

除了超强计算能力，scaleX万卡超集群还有诸多创新。

其中，中科曙光自主研发的scaleFabric网络，让传输像“高速公路”般通畅。这套网络可实现400Gb/s超高带宽、低于1微秒端侧通信延迟，充分释放万卡超集群算力，并可将超集群规模扩展至10万卡以上，相比传统IB网络提升2.33倍，网络总体成本降低30%。

与此同时，超集群实现了存、算、传紧耦合深度优化。它通过“超级隧道”、AI数据加速等设计，实现了从芯片级、系统级到应用级的三级数据传输协同优化，使存力平台高效应对大模型训练时万卡并发读写带宽需求挑战，提升高通量AI推理时的响应速度与结果精准度，并可将AI加速卡资源利用率提高55%。

还有超集群数字孪生与智能调度。通过物理集群数字孪生，能实现故障定位、修复等全流程可视化智能管理；智能化运维平台可支撑集群长期可用性达99.99%；智能调度引擎可管理万级节点、服务十万级用户，支持每秒万级作业调度。

scaleX万卡超集群能为国家重大战略和各行各业智能化加速提供澎湃、可靠的AI算力，展现了我国超大规模计算基础设施的研发、建设能力。

开放架构打破生态壁垒

着眼未来市场需求，算力应当是开放的生态系统，为千行百业赋能。国家先进计算产业创新中心主任历军表示：“市场需要开放、高效、安全、稳定的智能计算基础设施，应该建设开放、共享、分工、协作、团结、共赢的产业格局。”

中科曙光scaleX万卡超集群基于AI计算开放架构设计，支持多品牌加速卡以及主流计算生态，并实现超400个主流大模型、世界模型等适配优化，覆盖全球99%非闭源大模型。此次3套超节点同时上线试运行，证明了开放架构不仅是一个理念，更是具备大规模工程化落地能力的成熟方案，打造了AI计算开放架构的国家级“算力样板间”。

“scaleX万卡超集群，是曙光发挥大型计算机系统研制经验优势，面向万亿参数大模型、科学智能等复杂任务场景打造的大规模智能算力基础设施方案。”中科曙光高级副总裁李斌表示，面对人工智能基础设施对性能、效率、可靠性、可扩展性等方面的极致需求，scaleX万卡超集群无疑是当下的优质选择。（完）