avatar

StevenOcean

山重水复,柳暗花明

  • 首页
  • 我的博客
  • 科技热点
Home DeepSeek发布开源EP通信库DeepEP,助力MoE模型高效训练与推理
文章

DeepSeek发布开源EP通信库DeepEP,助力MoE模型高效训练与推理

Posted 2025-02-25 Updated 2025-02- 25
By Steven
0~1 min read

2月25日,人工智能公司DeepSeek在OpenSourceWeek第二日宣布推出开源EP通信库DeepEP,专为Mixture of Experts(MoE)模型的训练和推理优化。DeepEP支持高效的all-to-all通信,涵盖节点内和节点间操作,利用NVLink和RDMA技术,提供高吞吐量训练与预填充内核、低延迟推理解码内核,并原生支持FP8格式。该库灵活控制GPU资源,实现计算与通信的重叠,进一步提升大型语言模型性能。DeepSeek通过这一举措强化其开源承诺,GitHub链接已开放,供全球开发者使用,推动AI社区共同进步。

-- DeepSeek

科技热点
AI DeepSeek
License:  CC BY 4.0
Share

Further Reading

Mar 20, 2025

英伟达将斥资数千亿美元建设美国供应链

英伟达首席执行官黄仁勋表示,英伟达计划在未来四年内斥资数千亿美元采购美国制造的芯片和电子产品。面对唐纳德·特朗普总统的关税威胁,该公司正将其供应链从亚洲转移回来。英伟达设计的最新芯片以及用于数据中心的英伟达驱动服务器,现在可于台积电和鸿海在美国运营的工厂生产。黄仁勋表示:”总体而言,在未来四年里,我

Mar 20, 2025

xAI 和英伟达加入300亿美元的 AI 基金

马斯克的人工智能公司xAI和芯片制造商英伟达将成为贝莱德、微软和阿布扎比支持的一只巨额AI基础设施基金的合作伙伴。目前各公司竞相建设生成式人工智能所需的数据中心和能源项目。两家科技集团周三表示,他们将加入“AI基础设施合作伙伴关系”基金,计划最初从投资者和企业那里筹集300亿美元,目标是争取到高达1

Mar 20, 2025

软银以65亿美元收购芯片设计公司Ampere

软银集团已同意收购半导体设计公司安培计算机有限责任公司(Ampere),此举进一步扩大了这家日本投资公司在人工智能基础设施领域的努力。根据当地时间周三发布的联合声明,软银将以全现金方式收购 Ampere,这家总部位于美国加州圣克拉拉的公司的估值为65亿美元。Ampere 的早期支持者包括甲骨文公司和

OLDER

特斯拉准备在中国部署期待已久的 FSD 功能

NEWER

人工智能公司深度求索正加速推出R2模型

Recently Updated

  • 英伟达将斥资数千亿美元建设美国供应链
  • xAI 和英伟达加入300亿美元的 AI 基金
  • 软银以65亿美元收购芯片设计公司Ampere
  • "稚晖君"智元机器人发布首个通用具身基座大模型GO-1
  • 北京全市中小学将开展人工智能通识教育

Trending Tags

阿里 RISC-V Gemini Management Canvas 汽车 M4 Max ChatGPT 清华大学 Tool

Contents

©2025 StevenOcean. Some rights reserved.

Using the Halo theme Chirpy