挖掘有趣 Github 的猫。


有事联系:https://t.me/qumaobot
🍭 #高性能计算 #深度学习框架


🏵 DeepGEMM - NVIDIA GPU矩阵加速库


🍥 简介:
DeepGEMM是一款专为大型语言模型设计的高性能矩阵运算库。该程序基于CUDA架构构建,集成了FP8与FP4精度计算、混合专家模型(MoE)算子及注意力机制评估等核心功能。通过对底层计算路径的深度优化,显著提升了大规模模型在NVIDIA GPU上的推理与训练效率。


🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #图形API #高性能计算


🏵 Vulkan - 高性能图形计算

🍥 简介:
Vulkan是一种现代化的跨平台图形与计算API,旨在提供对GPU硬件的低级、精细控制。它支持高效的多线程渲染和并行计算,可显著降低CPU开销并提升性能。相较于OpenGL等传统API,Vulkan通过显式内存管理和命令缓冲提交,为开发人员构建高性能、低延迟的实时图形应用程序提供了强大且灵活的基础。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #内存管理 #AI工具 #开发工具 #高性能


🏵 Supermemory - 极速可伸缩内存机制应用

🍥 简介:
Supermemory 提供一种超快速、高扩展性的内存管理机制与应用程序。它为人工智能时代设计,旨在处理大规模数据与复杂计算的内存需求。作为一个强大的API,它使开发者能够高效地集成和操作内存,支持各类高性能AI应用,优化系统资源利用率。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
 
 
Back to Top