趣猫🐱 - 挖掘有趣 Github 的猫。有事联系：https://t.me/qumaobot

挖掘有趣 Github 的猫。

有事联系：https://t.me/qumaobot

19:43 · 2026年7月20日 · 周一

🍭 #大模型评估 #游戏逻辑测试

🏵 llm-bulls-and-cows-benchmark - LLM猜数字游戏逻辑评估框架

🍥 简介：
该轻量级框架旨在评估大语言模型在“猜数字”（Bulls and Cows）逻辑游戏中的性能表现。程序内置多种模型API接口，通过标准化测试流程量化模型的推理能力、逻辑遵循度及数字序列处理效率，为开发者提供客观的性能基准参考数据。

🎈 【进入项目】

🗣 活动线报 | 掘金项目

大模型评估游戏逻辑测试

05:48 · 2026年7月17日 · 周五

🍭 #人工智能 #大模型工具 #开发资源

🏵 LLMs-local - 本地运行大语言模型资源聚合

🍥 简介：
该项目整理了适用于本地部署大语言模型（LLM）的各类平台、开发工具及相关技术资源。内容涵盖了模型推理引擎、图形化管理界面以及部署环境配置方案，旨在帮助开发者在个人终端或本地服务器环境中高效运行、测试和集成大规模预训练模型，是进行本地化人工智能开发的重要参考库。

🎈 【进入项目】

🗣 活动线报 | 掘金项目

人工智能大模型工具开发资源

05:56 · 2026年7月4日 · 周六

🍭 #AI工具 #开发框架 #大语言模型

🏵 RLMs - 大语言模型任务分解与循环调用框架

🍥 简介：
RLMs框架旨在优化大语言模型对复杂长文本任务的处理能力。通过将大规模任务递归拆解为小型单元并支持循环调用，该系统能显著提升处理效率。核心特性包含本地及隔离环境下的代码执行支持，兼容主流模型服务商，并集成完善的模型训练与运行日志记录功能，适用于构建高度可扩展的自动化智能应用。

🎈 【进入项目】

🗣 活动线报 | 掘金项目

AI工具开发框架大语言模型

22:40 · 2026年6月30日 · 周二

🍭 #AI工具 #本地部署 #大模型交互

🏵 Open WebUI - 自托管ChatGPT风格AI界面

🍥 简介：
Open WebUI 是一款专为本地大模型设计的自托管Web交互平台。该程序支持集成 Ollama 及兼容 OpenAI API 的模型，内置 RAG（检索增强生成）引擎、文件上传解析、实时网页搜索及多用户权限管理功能。通过 Docker 命令即可完成私有化部署，实现完全离线、自主可控的 AI 交互环境，适用于需要保护数据隐私及深度定制化服务的应用场景。

🎈 【进入项目】

🗣 活动线报 | 掘金项目

AI工具本地部署大模型交互

19:37 · 2026年6月25日 · 周四

🍭 #AI开发工具 #大模型优化

🏵 Headroom - AI模型提示词与上下文压缩工具

🍥 简介：
Headroom 是一款本地化AI代理工具，通过压缩提示词、日志、文件及对话历史，显著降低LLM交互的Token消耗。该工具在保持输出质量的前提下，可实现60%至95%的压缩率。支持作为独立库、代理服务器、MCP服务器或代理包装器使用，在节省成本、提升处理速度的同时，支持完整还原原始数据，满足高效开发需求。

🎈 【进入项目】

🗣 活动线报 | 掘金项目

AI开发工具大模型优化

01:48 · 2026年6月6日 · 周六

🍭 #大语言模型 #开源教程 #深度学习

🏵 dive-into-llms - 大语言模型实践开发教程

🍥 简介：
该开源项目提供一系列免费教学资源，涵盖大语言模型微调、提示词工程、数学推理、安全对齐及智能体开发等核心领域。资料包含专业幻灯片、实操指南、代码运行环境及华为昇腾计算平台相关课程，旨在为开发者提供大模型全流程开发的系统性技术指导。

🎈 【进入项目】

🗣 活动线报 | 掘金项目

大语言模型开源教程深度学习

13:37 · 2026年5月30日 · 周六

🍭 #人工智能 #科研自动化 #大模型应用

🏵 AI Scientist-v2 - 全自动科学论文生成系统

🍥 简介：
该系统作为自主型人工智能代理，通过代理树搜索技术，自动化执行从构思科学课题、开展实验分析到撰写完整学术论文的全流程。系统无需人工模板介入，具备独立生成高质量科研成果的能力，且其产出的论文已成功通过ICLR工作坊的同行评审，实现了科研论文自动化生成的实质性进展。

🎈 【进入项目】

🗣 活动线报 | 掘金项目

人工智能科研自动化大模型应用

13:45 · 2026年5月20日 · 周三

🍭 #大模型 #Web端AI

🏵 WebLLM - 浏览器端大模型推理

🍥 简介：
WebLLM是一个高性能大型语言模型推理引擎。它支持在Web浏览器中直接进行硬件加速推理，所有操作均于浏览器本地完成，无需服务器支持，并利用WebGPU进行计算加速。

🎈 【进入项目】

🗣 活动线报 | 掘金项目

大模型 Web端AI

13:32 · 2026年5月12日 · 周二

🍭 #大语言模型 #AI智能体

🏵 MiniMax-M2.7 - 自主演化LLM

🍥 简介：
MiniMax-M2.7是一款新一代大型语言模型，具备在实际环境中自主演化并提升生产力的能力。不同于传统模型，M2.7通过代理团队、动态工具使用和强化学习循环，主动参与自身的持续改进过程。

🎈 【进入项目】

🗣 活动线报 | 掘金项目

大语言模型 AI智能体

16:36 · 2026年5月8日 · 周五

🍭 #大模型 #强化学习

🏵 Slime - 大模型强化学习框架

🍥 简介：
Slime 是一个专注于大型语言模型（LLMs）后训练的框架，旨在有效整合强化学习（RL）范式。该框架提供了一套工具和方法，使得LLMs能够在RL环境中进行扩展和优化，以处理更复杂的任务并提升决策能力。通过Slime，研究人员和开发者可以更便捷地探索LLMs在各种交互式场景中的应用潜力，推动LLMs与RL技术的深度融合，从而实现更智能、更自主的AI系统。

🎈 【进入项目】

🗣 活动线报 | 掘金项目

大模型强化学习

13:48 · 2026年5月7日 · 周四

🍭 #大语言模型 #API接口

🏵 Free-llm-api-resources - 免费大模型API推理资源列表

🍥 简介：
Free-llm-api-resources 是一个开源项目，专注于收集并整理基于大语言模型（LLM）推理的免费API资源。该项目为开发者和研究人员提供一个集中化的资源列表，以便快速查找并集成免费的LLM API服务。其内容涵盖了多种可用于语言生成、文本理解等任务的API接口，所有资源均可直接通过编程方式访问。

🎈 【进入项目】

🗣 活动线报 | 掘金项目

大语言模型 API接口

22:34 · 2026年4月6日 · 周一

🍭 #大模型工具 #AI代理

🏵 ClawRouter - 智能大模型路由，降低92%

🍥 简介：
ClawRouter是一个开源的智能大语言模型路由器，能够将AI API的使用成本降低92%。它在本地运行，通过分析每个请求的15个参数，并在1毫秒内将请求重定向到成本最低的可用模型。该系统专为自主AI代理设计。

🎈 【进入项目】

🗣 活动线报 | 掘金项目

大模型工具 AI代理

16:34 · 2026年4月5日 · 周日

🍭 #AI工具 #大模型

🏵 ReMind - AI大模型安全交互平台

🍥 简介：
ReMind是一个AI交互平台，设计用于促进与大型语言模型的沟通。该平台集成了健壮的聊天历史管理功能，支持多模态附件处理，并内置高级安全特性。它为AI驱动的通信提供稳定且安全的环境，适用于需要高效数据处理和隐私保护的多种应用场景。

🎈 【进入项目】

🗣 活动线报 | 掘金项目

AI工具大模型

13:46 · 2026年3月28日 · 周六

🍭 #医疗AI #大语言模型

🏵 MedLLMsPracticalGuide - 医疗大模型实践指南

🍥 简介：
本项目旨在提供医疗领域大语言模型（LLMs）的实践指导。内容涵盖LLMs在医疗场景的应用方法、技术框架及相关资源，系统性地汇集了包括概念树、数据表格与学术文章在内的专业资料，以支持医疗AI应用的开发与部署。

🎈 【进入项目】

🗣 活动线报 | 掘金项目

医疗AI 大语言模型

08:42 · 2025年11月7日 · 周五

🍭 #大语言模型 #开发运维工具

🏵 Harbor - 一键本地LLM环境搭建

🍥 简介：
Harbor 是一款面向本地大语言模型（LLM）开发环境的集成工具，支持通过简单命令快速启动 LLM 后端、API、前端和相关服务。它基于容器化架构，提供 CLI 和配套应用，支持常见主流推理引擎和多种 Web UI，适配图像生成、语音识别、RAG 检索等多种 AI 工作流。Harbor 集成配置管理、命令历史、配置导出等功能，方便开发者灵活扩展和定制本地 AI 堆栈，极大简化 LLM 环境部署和日常运维。

🎈 【进入项目】

🗣 羊毛撸货线报 | 合作/投稿

大语言模型开发运维工具

07:58 · 2025年10月18日 · 周六

🍭 #AI框架 #大模型工具

🏵 MemOS - 大模型记忆操作系统

🍥 简介：
MemOS 是专为大语言模型设计的记忆增强操作系统，帮助模型实现长期记忆存储、检索和管理，显著提升上下文感知和推理表现。它通过模块化架构，支持文本记忆、激活缓存和参数记忆等多种类型，灵活扩展、便于集成不同数据源和模型。开发者可通过统一 API 快速实现记忆读写、用户管理和多种记忆操作，极大提升多轮对话、复杂推理和个性化场景下的 LLM 应用能力。适用于研究、产品开发及定制化智能体系统。

🎈 【进入项目】

🗣 羊毛撸货线报 | 合作/投稿

AI框架大模型工具

08:28 · 2025年9月25日 · 周四

🍭 #大语言模型 #深度学习

🏵 Byte Latent Transformer - 字节级LLM架构

🍥 简介：
Byte Latent Transformer（BLT）是一种创新的字节级大模型架构，无需分词即可端到端处理原始字节流，极大提升了推理效率和健壮性。它通过动态分割字节为可变长度的“Patch”片段，实现按需分配算力，适应不同数据复杂度。BLT引入了新的注意力机制，增强了字节与Patch间的信息流动，并包含专用的字节序列记忆。官方代码支持大规模模型训练和推理，可直接加载权重并生成文本，适合探索高效、灵活的LLM新范式和大规模预训练研究。

🎈 【进入项目】

🗣 羊毛撸货线报 | 合作/投稿

大语言模型深度学习

20:47 · 2025年5月1日 · 周四

🗣 每日羊毛线报 👈

🏵 Plandex - 面向大型项目的AI编程代理

🍥 简介：
Plandex 是一款专为大型项目和复杂实际任务设计的终端 AI 编程代理。它能够规划并执行跨越多个文件、包含多个步骤的编码任务，支持高达 2M Token 的直接上下文处理，并能通过 tree-sitter 索引管理超大规模代码库。其核心特性包括智能上下文管理、用于安全审查 AI 修改的累积差异沙箱，以及可控的命令执行与调试回滚机制。Plandex 支持整合 Anthropic、OpenAI 等多种模型，提供从完全自主到精细控制的可配置工作流，旨在高效、可靠地辅助开发者完成复杂编码工作。

🍭 #AI编程 #大型项目

🎈 【进入项目】

🎯 关注频道 🤖 合作/投稿

AI编程大型项目

16:05 · 2025年4月18日 · 周五

🗣 每日羊毛线报 👈

🏵 Skywork-OR1 - 增强数学与代码推理

🍥 简介：
Skywork-OR1 (Open Reasoner 1) 是一个专注于提升大型语言模型在数学和代码领域推理能力的项目。其核心技术是采用基于规则的大规模强化学习（RL），并结合精心设计的数据集与训练流程。该项目发布了一系列模型，包括专精数学的 Skywork-OR1-Math-7B，以及通用推理预览版 Skywork-OR1-7B/32B-Preview。这些模型在数学（如 AIME 基准测试）和代码（如 LiveCodeBench）推理任务上展现出领先性能，部分模型甚至能媲美参数量远超自身的模型。项目已开源模型权重、RL 训练数据及相关代码。

🍭 #大语言模型 #强化学习

🎈 【进入项目】

🎯 关注频道 🤖 合作/投稿

大语言模型强化学习

Home