DeepSeek开源第三弹:开源FP8通用矩阵乘法库DeepGEMM
科技
科技 > 人工智能 > 正文
站内

DeepSeek开源第三弹:开源FP8通用矩阵乘法库DeepGEMM

鞭牛士 2月26日消息,DeepSeek公布开源周第三天的开源项目——DeepGEMM。

微信截图_20250226094341.png

据介绍,DeepGEMM是一个支持密集型和混合专家(MoE)通用矩阵乘法(GEMM)运算的 FP8 通用矩阵乘法库,它为V3/R1模型的训练和推理提供支持。

DeepGEMM在英伟达Hopper系列GPU上可实现高达1350以上的FP8每秒万亿次浮点运算(TFLOPS);完全即时编译;核心逻辑代码约300行——但在大多数矩阵规模下,其性能超过了经过专家优化调整的内核;支持密集型布局以及两种混合专家(MoE)布局。

[责任编辑:冯皓钦 PT132]

推荐0

为您推荐

算法反馈
已显示全部内容

凤凰网科技官方微信

亲爱的凤凰网用户:

您当前使用的浏览器版本过低,导致网站不能正常访问,建议升级浏览器

第三方浏览器推荐:

谷歌(Chrome)浏览器 下载

360安全浏览器 下载