挖掘有趣 Github 的猫。


有事联系:https://t.me/qumao?direct
🍭 #深度学习 #文本生成


🏵 gpt-fast - 高效PyTorch文本生成

🍥 简介:
gpt-fast 是一款基于 PyTorch 的极简高效 Transformer 文本生成工具,核心代码不足1000行,仅依赖 PyTorch 和 sentencepiece,无需额外复杂依赖。支持 int8/int4 量化、推测式解码、张量并行,并兼容 Nvidia 与 AMD GPU,具备极低延迟。适配 LLaMA、Mixtral 8x7B 等主流模型,适合开发者用于快速实验、定制和性能优化。该项目不做大型框架,仅作为高性能 PyTorch 推理实现的参考和起点,便于学习和二次开发。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🍭 #深度学习 #多模态AI


🏵 Tiny Qwen - Qwen模型轻量复现

🍥 简介:
Tiny Qwen 是一个简洁易读的 PyTorch 项目,主要对 Qwen3 和 Qwen2.5-VL 大语言模型进行了轻量级复现。支持纯文本和图像多模态输入,以及稠密与混合专家架构,便于快速上手和学习。项目提供完善的命令行交互体验,适配 GPU 自动部署,代码结构清晰,适合模型原理研究与二次开发。相比官方实现,本项目去除冗余,易于理解,非常适合想深入掌握大模型推理与多模态处理的开发者和研究者。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🍭 #计算机视觉 #深度学习


🏵 DINOv3 - 高效视觉特征提取

🍥 简介:
DINOv3 是 Meta AI 推出的新一代视觉基础模型,采用 PyTorch 实现,支持多种高性能 ViT 和 ConvNeXt 架构。该项目提供丰富的预训练模型,具备高分辨率稠密特征输出,无需微调即可在分类、检测、分割等多项视觉任务上达到领先水平。模型权重可直接通过 PyTorch Hub 或 Hugging Face 加载,支持自定义数据集训练和评估。DINOv3 还配套完整的训练、推理及数据处理工具,适合科研和工业级视觉算法开发使用。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🍭 #大语言模型 #深度学习


🏵 Byte Latent Transformer - 字节级LLM架构

🍥 简介:
Byte Latent Transformer(BLT)是一种创新的字节级大模型架构,无需分词即可端到端处理原始字节流,极大提升了推理效率和健壮性。它通过动态分割字节为可变长度的“Patch”片段,实现按需分配算力,适应不同数据复杂度。BLT引入了新的注意力机制,增强了字节与Patch间的信息流动,并包含专用的字节序列记忆。官方代码支持大规模模型训练和推理,可直接加载权重并生成文本,适合探索高效、灵活的LLM新范式和大规模预训练研究。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🗣 每日羊毛线报 👈


🏵 Beyond-NanoGPT - 深度学习研究教程

🍥 简介:
Beyond-NanoGPT 是一个旨在弥合 nanoGPT 和研究级深度学习之间差距的教育性代码库。它提供了近 100 种前沿深度学习技术的最小化和注释实现,帮助初学者学习并开始自己的实验。涵盖了 LLM 的 KV 缓存和推测解码,视觉 Transformer 和 MLP-Mixer 等架构,以及 PPO、A3C 和 AlphaZero 等强化学习算法。代码注释详细解释了论文和生产代码中经常忽略的细节。

🍭 #深度学习 #LLM #代码教程


🎈 【进入项目】


🎯 关注频道 🤖 合作/投稿
🗣 每日羊毛线报 👈


🏵 MyOCR - OCR系统构建框架

🍥 简介:
MyOCR 是一款高度可扩展的 OCR 系统构建框架,旨在帮助开发者轻松训练和集成深度学习模型,构建自定义 OCR 方案。它提供端到端开发流程,支持模块化组件的灵活组合,可替换模型、预测器等。MyOCR 提供简洁的 Python API 和预定义模型,并支持 ONNX 运行时以实现快速 CPU/GPU 推理,满足生产级性能需求。

🍭 #OCR #深度学习


🎈 【进入项目】


🎯 关注频道 🤖 合作/投稿
🗣 每日羊毛线报 👈


🏵 Watermark Segmentation - 图像水印精确分割

🍥 简介:
Watermark Segmentation 是由 DiffusionDynamics.aiclear.photo 开源的项目,专注于图像中水印(如图标、文字)的精确分割。该项目利用深度学习技术,结合 PyTorch 框架与合成数据增强方法,生成准确的水印区域遮罩 (mask)。其代码参考了相关领域的前沿研究,旨在提供一个简洁、可扩展的水印识别基线代码。这是实现高级水印移除(如 clear.photo 所用技术)的关键第一步,代码易于理解和修改,并支持在本地硬件上进行微调。

🍭 #图像处理 #深度学习


🎈 【进入项目】


🎯 关注频道 🤖 合作/投稿
🗣 每日羊毛线报 👈


🏵 NVIDIA DLI - 深度学习实战培训

🍥 简介:
NVIDIA 深度学习培训中心 (DLI) 提供生成式 AI、深度学习、加速计算等前沿技术的实战培训。通过云端 GPU 实验环境,开发者、数据科学家等可快速掌握端到端应用开发技能,并获得 NVIDIA 全球认证证书,助力职业发展。课程涵盖从基础到高阶的内容,支持灵活学习方式,包括在线自主培训和讲师指导的培训班:cite[1]:cite[7]。

🍭 #深度学习 #AI培训


🎈 【进入项目】


🎯 关注频道 🤖 合作/投稿
 
 
Back to Top