365文库

登录

注册

DeepSeek扔的第二枚开源

2025-02-26 08:55 头条推荐来源：365文库

下载成Word

今日，DeepSeek 开源周进入第二日。清晨，DeepSeek 依照约定，重磅推出开源代码库 DeepEP。据悉，DeepEP 作为首个面向 MoE 模型训练与推理的开源 EP 通信库，成功填补了 MoE 模型专用通信工具领域的空白。它为大规模分布式 AI 训练以及实时推理场景，提供了更为高效的底层技术支撑，有望推动相关领域迈向新的发展阶段。

DeepSeek扔的第二枚开源特点

1、高效通信架构

支持优化的全对全通信模式，实现节点内和节点间的NVLink与RDMA互联，提升数据传输效率

2、多精度与调度优化

原生支持FP8低精度运算调度，降低计算资源消耗。

3、重性能内核

据介绍，高吞吐量内核可适用于训练和推理预填充场景，最大化数据处理能力；

4、低延迟内核

它针对推理解码场景设计，采用纯RDMA通信和自适应路由技术，减少延迟。

5、资源控制与重叠机制

通过灵活的GPU资源控制策略，实现计算与通信过程的高效重叠，避免资源闲置。

6、深度优化场景

针对NVLink到RDMA的非对称带宽转发场景进行专项优化，提升异构网络下的传输性能；

此外，它还支持SM（Streaming Multiprocessors）数量动态控制，平衡不同任务（如训练与推理）的吞吐量需求。

热门文档

新高考录取批次和志愿如何设置？

新高考录取批次和志愿如何设置？

105阅读 | 4收藏

“解散教育部”在美引尖锐对立

204阅读 | 9收藏

老旧营运货车报废更新补贴标准

198阅读 | 7收藏

老旧营运货车报废更新资金申请表

老旧营运货车报废更新资金申请表

198阅读 | 6收藏

生活饮用水卫生标准GB5749-2022

生活饮用水卫生标准GB5749-2022

255阅读 | 8收藏

下载二维码

App功能展示

海量免费资源

海量免费资源

文档在线修改

文档在线修改

图片转文字

图片转文字

限时免广告

限时免广告

多端同步存储

多端同步存储

格式轻松转换

格式轻松转换