中科曙光发布国内首个开放架构AI超集群系统,可支持百万卡扩展

资讯 » 科技头条 2025-09-05

9月5日,在2025重庆世界智能产业博览会上,中科曙光(603019.SH)发布了国内首个基于AI计算开放架构设计的产品——曙光AI超集群系统。该系统以GPU为核心,实现了“算、存、网、电、冷、管、软”一体化紧耦合设计,具备“超高性能、超高效率、超高可靠、全面开放”四大特点,可为万亿参数大模型训练推理、行业大模型微调、多模态大模型开发、AI4S等场景提供高效算力底座。

曙光AI超集群系统具有如下技术特点:

超高性能:单机柜可搭载96张GPU卡、算力规模达百P级、访存总带宽超180TB/s;支持多精度、混合精度运算;支持百万卡超大集群扩展。

超高效率:千卡集群大模型训练推理性能达到业界主流水平2.3倍、开发效率提升4倍、人天投入减少70%;存算传协同,提升GPU计算效率55%;先进冷板液冷,394项节能设计PUE低于1.12。

超高可靠:121项设备和链路RAS可靠性设计;平均无故障时间(MTBF)提高2.1倍;平均故障修复时间(MTTR)降低47%;超30天长稳运行集群可靠性测试;实现百万级部件故障自动分析与秒级隔离。

全面开放:基于AI计算开放架构设计;硬件适配多品牌AI加速卡;软件兼容主流AI计算生态;多项技术能力开放与共享。




免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。由用户投稿,经过编辑审核收录,不代表头部财经观点和立场。
证券投资市场有风险,投资需谨慎!请勿添加文章的手机号码、公众号等信息,谨防上当受骗!如若本网有任何内容侵犯您的权益,请及时联系我们。