新华网天津 > 正文
2026 02/06 18:32:34来源: 新华网

中科曙光支撑国家级算力枢纽 3套万卡超集群同时上线试运行

2026-02-06 18:32:34    来源: 新华网
字体:
分享到:

  新华网天津2月6日电(记者毛振华、梁姊)国家超算互联网核心节点2月5日在郑州上线试运行。作为全国一体化算力网的算力供应方,位于天津滨海高新区的曙光信息产业股份有限公司(简称“中科曙光”)研发、生产的scaleX万卡超集群为核心节点提供算力支撑。

  为核心节点提供支撑

  2023年10月,国家超算互联网核心节点项目在郑州启动建设,旨在构建全球领先的国家级算力设施、调度枢纽与服务平台,有力支撑人工智能、科学研究、数字经济等多领域高质量发展。

  随着项目上线试运行,核心节点部署运行的3套由中科曙光提供的scaleX万卡超集群马力全开,最大可对外提供超3万卡的国产AI算力,能够为各类AI大模型训练、高通量推理、AI for Science等大规模AI计算应用场景提供高效、安全、普惠的算力服务。

  scaleX万卡超集群究竟是什么呢?它在2025年12月的光合组织人工智能创新大会上首次以真机形式亮相,这是中科曙光发挥大型计算机系统研制经验优势,面向万亿参数大模型、科学智能等复杂任务场景,打造的大规模智能算力基础设施方案。scaleX万卡超集群攻克了高速互联网络、存算传紧耦合设计、高密供电与散热、统一资源高效调度等关键技术。

  超强算力展现不俗实力

  除了超强计算能力,scaleX万卡超集群还有诸多创新。

  其中,中科曙光自主研发的scaleFabric网络,让传输像“高速公路”般通畅。这套网络可实现400Gb/s超高带宽、低于1微秒端侧通信延迟,充分释放万卡超集群算力,并可将超集群规模扩展至10万卡以上,相比传统IB网络提升2.33倍,网络总体成本降低30%。

  与此同时,超集群实现了存、算、传紧耦合深度优化。它通过“超级隧道”、AI数据加速等设计,实现了从芯片级、系统级到应用级的三级数据传输协同优化,使存力平台高效应对大模型训练时万卡并发读写带宽需求挑战,提升高通量AI推理时的响应速度与结果精准度,并可将AI加速卡资源利用率提高55%。

  还有超集群数字孪生与智能调度。通过物理集群数字孪生,能实现故障定位、修复等全流程可视化智能管理;智能化运维平台可支撑集群长期可用性达99.99%;智能调度引擎可管理万级节点、服务十万级用户,支持每秒万级作业调度。

  scaleX万卡超集群能为国家重大战略和各行各业智能化加速提供澎湃、可靠的AI算力,展现了我国超大规模计算基础设施的研发、建设能力。

  开放架构打破生态壁垒

  着眼未来市场需求,算力应当是开放的生态系统,为千行百业赋能。国家先进计算产业创新中心主任历军表示:“市场需要开放、高效、安全、稳定的智能计算基础设施,应该建设开放、共享、分工、协作、团结、共赢的产业格局。”

  中科曙光scaleX万卡超集群基于AI计算开放架构设计,支持多品牌加速卡以及主流计算生态,并实现超400个主流大模型、世界模型等适配优化,覆盖全球99%非闭源大模型。此次3套超节点同时上线试运行,证明了开放架构不仅是一个理念,更是具备大规模工程化落地能力的成熟方案,打造了AI计算开放架构的国家级“算力样板间”。

  “scaleX万卡超集群,是曙光发挥大型计算机系统研制经验优势,面向万亿参数大模型、科学智能等复杂任务场景打造的大规模智能算力基础设施方案。”中科曙光高级副总裁李斌表示,面对人工智能基础设施对性能、效率、可靠性、可扩展性等方面的极致需求,scaleX万卡超集群无疑是当下的优质选择。(完)

【责任编辑:冯娟】