趣猫🐱
3 天前
🍭
#高性能计算 #深度学习框架
🏵
DeepGEMM
- NVIDIA GPU矩阵加速库
🍥
简介:
DeepGEMM是一款专为大型语言模型设计的高性能矩阵运算库。该程序基于CUDA架构构建,集成了FP8与FP4精度计算、混合专家模型(MoE)算子及注意力机制评估等核心功能。通过对底层计算路径的深度优化,显著提升了大规模模型在NVIDIA GPU上的推理与训练效率。
🎈
【进入项目】
🗣
活动线报
|
掘金项目
Home
Powered by
BroadcastChannel
&
Sepia