Enable javascript in your browser for better experience. Need to know to enable it? Go here.
发布于 : Nov 05, 2025
Nov 2025
评估 ?

DeepSpeed 是一个 Python 库,用于优化分布式深度学习的训练和推理。对于训练,它集成了 Zero Redundancy Optimizer (ZeRO) 和 3D 并行等技术,以高效地在数千 GPU 上扩展模型。对于推理,它结合了张量并行、流水线并行、专家并行和 ZeRO 并行,并通过自定义内核和通信优化来最小化延迟。DeepSpeed 支持世界上一些最大的语言模型,包括 Megatron-Turing NLG(530B)和 BLOOM(176B)。它兼容稠密模型和稀疏模型,提供高系统吞吐量,并允许在多 GPU 资源受限的环境下进行训练或推理。该库可与流行的 Hugging Face Transformers、PyTorch Lightning 和 Accelerate 无缝集成,是大规模或资源受限深度学习工作负载的高效解决方案。

Download the PDF

 

 

 

English | Español | Português | 中文

Sign up for the Technology Radar newsletter

 

 

Subscribe now

查看存档并阅读往期内容