挖掘有趣 Github 的猫。


有事联系:https://t.me/qumaobot
🍭 #深度学习 #多模态AI


🏵 Tiny Qwen - Qwen模型轻量复现

🍥 简介:
Tiny Qwen 是一个简洁易读的 PyTorch 项目,主要对 Qwen3 和 Qwen2.5-VL 大语言模型进行了轻量级复现。支持纯文本和图像多模态输入,以及稠密与混合专家架构,便于快速上手和学习。项目提供完善的命令行交互体验,适配 GPU 自动部署,代码结构清晰,适合模型原理研究与二次开发。相比官方实现,本项目去除冗余,易于理解,非常适合想深入掌握大模型推理与多模态处理的开发者和研究者。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🍭 #大语言模型 #深度学习


🏵 Byte Latent Transformer - 字节级LLM架构

🍥 简介:
Byte Latent Transformer(BLT)是一种创新的字节级大模型架构,无需分词即可端到端处理原始字节流,极大提升了推理效率和健壮性。它通过动态分割字节为可变长度的“Patch”片段,实现按需分配算力,适应不同数据复杂度。BLT引入了新的注意力机制,增强了字节与Patch间的信息流动,并包含专用的字节序列记忆。官方代码支持大规模模型训练和推理,可直接加载权重并生成文本,适合探索高效、灵活的LLM新范式和大规模预训练研究。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🗣 每日羊毛线报 👈


🏵 Beyond-NanoGPT - 深度学习研究教程

🍥 简介:
Beyond-NanoGPT 是一个旨在弥合 nanoGPT 和研究级深度学习之间差距的教育性代码库。它提供了近 100 种前沿深度学习技术的最小化和注释实现,帮助初学者学习并开始自己的实验。涵盖了 LLM 的 KV 缓存和推测解码,视觉 Transformer 和 MLP-Mixer 等架构,以及 PPO、A3C 和 AlphaZero 等强化学习算法。代码注释详细解释了论文和生产代码中经常忽略的细节。

🍭 #深度学习 #LLM #代码教程


🎈 【进入项目】


🎯 关注频道 🤖 合作/投稿
🗣 每日羊毛线报 👈


🏵 Deep Research - LLM深度研究报告

🍥 简介:
Deep Research 利用多种 AI 模型,在数分钟内生成深度研究报告。它结合“思考”和“任务”模型,并接入互联网,提供快速且有洞见的分析。所有数据本地处理存储,保障用户隐私。支持 Gemini、OpenAI 等主流 LLM,以及 Searxng 等搜索引擎,实现便捷的网络搜索功能。用户可随时调整研究内容,生成知识图谱,并支持本地知识库。

🍭 #LLM #深度研究


🎈 【进入项目】


🎯 关注频道 🤖 合作/投稿
🗣 每日羊毛线报 👈


🏵 Watermark Segmentation - 图像水印精确分割

🍥 简介:
Watermark Segmentation 是由 DiffusionDynamics.aiclear.photo 开源的项目,专注于图像中水印(如图标、文字)的精确分割。该项目利用深度学习技术,结合 PyTorch 框架与合成数据增强方法,生成准确的水印区域遮罩 (mask)。其代码参考了相关领域的前沿研究,旨在提供一个简洁、可扩展的水印识别基线代码。这是实现高级水印移除(如 clear.photo 所用技术)的关键第一步,代码易于理解和修改,并支持在本地硬件上进行微调。

🍭 #图像处理 #深度学习


🎈 【进入项目】


🎯 关注频道 🤖 合作/投稿
 
 
Back to Top