DeepSeek致谢腾讯技术团队:这是一次“巨大的加速”代码贡献!

5月7日消息,DeepSeek致谢腾讯技术团队,这是一次巨大的加速代码贡献。

据新浪报道,腾讯技术团队针对DeepSeek开源的DeepEP通信框架进行深度优化,使其在多种网络环境下均实现显著性能提升。

经测试,优化后的通信框架性能在RoCE网络环境提升100%,IB网络环境提升30%,为企业开展AI大模型训练提供更高效的解决方案。

该技术方案获得了DeepSeek公开致谢,称这是一次huge speedup(巨大的加速)代码贡献。

据了解,自今年2月DeepSeek开源包括DeepEP在内的五大代码库以来,该团队便向业界展示了如何利用有限的硬件资源实现接近万卡集群的性能。

在这些技术中,DeepEP凭借突破性的方法提升了300%的通信效率,成功解决了MoE架构大模型对英伟达NCCL的依赖问题。但该技术在成本较低、适用面更广的RoCE网络环境中表现不佳,限制了其在更广泛场景的应用。这一痛点引发了开源社区的持续讨论。

据悉,腾讯星脉网络团队在DeepEP开源后便展开技术攻关,发现两大关键瓶颈:一是对于双端口网卡带宽利用率不足,二是CPU控制面交互存在时延。

在腾讯的技术优化下,DeepEP不仅在RoCE网络实现性能翻倍,反哺到IB(InfiniBand)网络时更使原有通信效率再提升30%。

目前,该技术已全面开源,并成功应用于腾讯混元大模型等项目的训练推理,在腾讯星脉与H20服务器构建的高性能环境中,这套方案展现出出色的通用性。

DeepSeek致谢腾讯技术团队:这是一次“巨大的加速”代码贡献!

标签:

honglian
cc 管理员

  • 声明:本文由cc于2025-05-07发表在imtoken官网下载/imtoken钱包下载/imtoken安卓版app下载/imtoken钱包app下载,如有疑问,请联系我们。
  • 本文地址:https://www.hk-sz.com/imtoken/4400.html
上一篇:刘强东给李国庆送外卖了!满满一桌子 感谢李总发声支持京东外卖
下一篇:首发高精度固态激光雷达 华为全向防碰撞再升级:倒车不掉沟里