当前位置:首页 >焦点 >突破大算力瓶颈:华为支持超万亿参数大模型训练 为支万亿还深度开放底层能力

突破大算力瓶颈:华为支持超万亿参数大模型训练 为支万亿还深度开放底层能力

2024-06-30 16:56:39 [百科] 来源:避面尹邢网

突破大算力瓶颈:华为支持超万亿参数大模型训练

作者:随心 商务办公 为了加速大模型创新,突破华为发布了更开放、大算大模更易用的力瓶练CANN7.0,不仅全面兼容业界的颈华AI框架、加速库和主流大模型,为支万亿还深度开放底层能力,持超参数让AI框架和加速库可以更直接地调用和管理计算资源,型训使能开发者自定义高性能算子。突破

在华为全联接大会2023期间,大算大模华为正式发布全新架构的力瓶练昇腾AI计算集群——Atlas 900 SuperCluster,可支持超万亿参数的颈华大模型训练。

华为常务董事、为支万亿ICT基础设施业务管理委员会主任、持超参数企业BG总裁汪涛介绍,型训新集群采用全新的突破华为星河AI智算交换机CloudEngine XH16800,借助其高密的800GE端口能力,两层交换网络即可实现2250节点(等效于18000张卡)超大规模无收敛集群组网。

突破大算力瓶颈:华为支持超万亿参数大模型训练 为支万亿还深度开放底层能力

新集群同时使用了创新的超节点架构,大大提升了大模型训练能力。

突破大算力瓶颈:华为支持超万亿参数大模型训练 为支万亿还深度开放底层能力

此外,发挥华为在计算、网络、存储、能源等领域的综合优势,从器件级、节点级、集群级和业务级全面提升系统可靠性,将大模型训练稳定性从天级提升到月级。

突破大算力瓶颈:华为支持超万亿参数大模型训练 为支万亿还深度开放底层能力

为了加速大模型创新,华为发布了更开放、更易用的CANN7.0,不仅全面兼容业界的AI框架、加速库和主流大模型,还深度开放底层能力,让AI框架和加速库可以更直接地调用和管理计算资源,使能开发者自定义高性能算子。

汪涛表示,随着人工智能进入大模型时代,大算力正在成为人工智能发展的核心引擎。华为改变传统的服务器堆叠模式,以系统架构创新打造AI集群,实现算力、运力、存力的一体化设计,突破大算力瓶颈。

责任编辑:武晓燕 来源: 快科技 算力AI框架

(责任编辑:焦点)

    推荐文章
    热点阅读