趣猫🐱 - 挖掘有趣 Github 的猫。有事联系：https://t.me/qumaobot

挖掘有趣 Github 的猫。

有事联系：https://t.me/qumaobot

22:36 · 2026年7月6日 · 周一

🍭 #人工智能 #AI架构 #开源项目

🏵 All-agentic-architectures - 35种工业级AI智能体架构实现

🍥 简介：
本项目提供包含Reflexion、LATS、GraphRAG、MemGPT、Voyager及BrowserAgent等在内的35种主流AI智能体架构。作为基于Python开发的教学库，其支持多模型接入，并配套详尽的架构解析。通过整合17项基准任务的性能评测体系，为开发者深入理解与应用大规模语言模型智能体架构提供了标准化参考框架。

🎈 【进入项目】

🗣 活动线报 | 掘金项目

人工智能 AI架构开源项目

03:36 · 2026年6月10日 · 周三

🍭 #AI工具 #开发辅助

🏵 Agent Skills - 软件工程自动化执行流程

🍥 简介：
该项目为代码编写类AI代理提供了一套标准化的工作流程，对标资深工程师的软件开发生命周期。框架包含定义、规划、创建、测试、评审、发布六个阶段，共涵盖20项核心技能。每个阶段均配备结构化的步骤指引、质量核查点及验证要求，旨在提升AI在复杂软件开发任务中的执行效率与代码质量。

🎈 【进入项目】

🗣 活动线报 | 掘金项目

AI工具开发辅助

19:37 · 2026年6月2日 · 周二

🍭 #开源工具 #AI开发平台

🏵 Langfuse - LLM应用全流程管理平台

🍥 简介：
Langfuse 是一款开源的大模型应用开发平台，提供对 LLM 应用的监控、评估与调试功能。系统支持应用逻辑链路追踪、提示词管理、数据集构建及沙盒测试，并兼容 OpenAI、LangChain 及 LlamaIndex 等主流开发框架，通过可视化界面实现对模型性能与响应质量的实时监测与深度优化。

🎈 【进入项目】

🗣 活动线报 | 掘金项目

开源工具 AI开发平台

05:47 · 2026年5月10日 · 周日

🍭 #AI工具 #安全测试

🏵 PentAGI - AI自动化渗透测试

🍥 简介：
PentAGI是一款先进的AI驱动工具，专为自动化渗透测试而设计。它通过智能代理，集成并运用Nmap、Metasploit等逾20种专业安全工具。所有操作均在安全的Docker沙箱环境中执行，确保测试过程的隔离性和有效性，从而提升安全评估效率。

🎈 【进入项目】

🗣 活动线报 | 掘金项目

AI工具安全测试

01:47 · 2026年3月17日 · 周二

🍭 #AI工具 #可观测性

🏵 Phoenix - AI可观测性平台

🍥 简介：
Phoenix是一个开源的人工智能可观测性平台。它专为AI模型的实验、评估及故障排除而设计，提供全面的功能集以监控模型性能、分析数据流、识别潜在问题并加速开发迭代。该平台支持数据科学家和机器学习工程师高效管理AI工作流，确保系统稳定运行和优化。

🎈 【进入项目】

🗣 活动线报 | 掘金项目

AI工具可观测性

05:58 · 2026年1月13日 · 周二

🍭 #合规检测 #文档分析 #法律科技 #AI应用

🏵 合规编译器 - 文档法规不合规检测

🍥 简介：
Compliance Compiler是一款开放核心工具，专注于识别文档及司法判决中的形式和法规不合规项。该工具不提供任何法律评估或建议，以确定性、可复现和安全的方式运行。其核心功能包括规范与权限层级分析，并提供可选的AI解析能力，支持用户更换大型语言模型（LLM）提供商。项目提供命令行、Web界面及API多种交互模式，采用AGPL-3.0开源协议。

🎈 【进入项目】

🗣 羊毛撸货线报 | 合作/投稿

合规检测文档分析法律科技 AI应用

10:17 · 2025年10月19日 · 周日

🍭 #AI评测 #机器学习工程

🏵 MLE-bench - AI代理ML工程基准

🍥 简介：
MLE-bench 是专为评估 AI 代理在机器学习工程任务中表现而设计的公开基准工具。它基于真实 Kaggle 竞赛数据集，支持多种任务类型（如图像、文本、表格、音频等），可自动化数据准备、分割、评分和结果统计，便于全面衡量不同智能体在模型开发、数据处理和自动化工程流程上的能力。系统提供标准评测流程、轻量级测试集、自动化评分脚本及丰富的实验配置，适合研究人员、开发者或团队对比和优化 AI 代理在实际 ML 工程场景下的综合能力。

🎈 【进入项目】

🗣 羊毛撸货线报 | 合作/投稿

AI评测机器学习工程

15:40 · 2025年8月7日 · 周四

🗣 每日羊毛线报 👈

🏵 Dingo - AI数据质量评估工具

🍥 简介：
Dingo 是一款专业的AI数据质量评估工具，致力于自动化检测数据集中的各类质量问题。它全面支持文本与图像等多模态数据，覆盖从预训练到微调、评测的全流程。该工具融合了基于规则与模型的双重评估体系，内置二十余种通用规则，并集成主流大模型进行幻觉检测与RAG评估。提供CLI和SDK两种调用方式，便于无缝集成到现有工作流中。

🍭 #AI数据质量 #评估工具

🎈 【进入项目】

🎯 关注频道 🤖 合作/投稿

AI数据质量评估工具