挖掘有趣 Github 的猫。


有事联系:https://t.me/qumaobot
🍭 #高性能计算 #深度学习框架


🏵 DeepGEMM - NVIDIA GPU矩阵加速库


🍥 简介:
DeepGEMM是一款专为大型语言模型设计的高性能矩阵运算库。该程序基于CUDA架构构建,集成了FP8与FP4精度计算、混合专家模型(MoE)算子及注意力机制评估等核心功能。通过对底层计算路径的深度优化,显著提升了大规模模型在NVIDIA GPU上的推理与训练效率。


🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #深度学习 #文本生成


🏵 gpt-fast - 高效PyTorch文本生成

🍥 简介:
gpt-fast 是一款基于 PyTorch 的极简高效 Transformer 文本生成工具,核心代码不足1000行,仅依赖 PyTorch 和 sentencepiece,无需额外复杂依赖。支持 int8/int4 量化、推测式解码、张量并行,并兼容 Nvidia 与 AMD GPU,具备极低延迟。适配 LLaMA、Mixtral 8x7B 等主流模型,适合开发者用于快速实验、定制和性能优化。该项目不做大型框架,仅作为高性能 PyTorch 推理实现的参考和起点,便于学习和二次开发。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🗣 每日羊毛线报 👈


🏵 MyOCR - OCR系统构建框架

🍥 简介:
MyOCR 是一款高度可扩展的 OCR 系统构建框架,旨在帮助开发者轻松训练和集成深度学习模型,构建自定义 OCR 方案。它提供端到端开发流程,支持模块化组件的灵活组合,可替换模型、预测器等。MyOCR 提供简洁的 Python API 和预定义模型,并支持 ONNX 运行时以实现快速 CPU/GPU 推理,满足生产级性能需求。

🍭 #OCR #深度学习


🎈 【进入项目】


🎯 关注频道 🤖 合作/投稿
🗣 每日羊毛线报 👈


🏵 Watermark Segmentation - 图像水印精确分割

🍥 简介:
Watermark Segmentation 是由 DiffusionDynamics.aiclear.photo 开源的项目,专注于图像中水印(如图标、文字)的精确分割。该项目利用深度学习技术,结合 PyTorch 框架与合成数据增强方法,生成准确的水印区域遮罩 (mask)。其代码参考了相关领域的前沿研究,旨在提供一个简洁、可扩展的水印识别基线代码。这是实现高级水印移除(如 clear.photo 所用技术)的关键第一步,代码易于理解和修改,并支持在本地硬件上进行微调。

🍭 #图像处理 #深度学习


🎈 【进入项目】


🎯 关注频道 🤖 合作/投稿
 
 
Back to Top