挖掘有趣 Github 的猫。


有事联系:https://t.me/qumaobot
🍭 #AI工具 #开发辅助

🏵 Agent Skills - 软件工程自动化执行流程

🍥 简介:
该项目为代码编写类AI代理提供了一套标准化的工作流程,对标资深工程师的软件开发生命周期。框架包含定义、规划、创建、测试、评审、发布六个阶段,共涵盖20项核心技能。每个阶段均配备结构化的步骤指引、质量核查点及验证要求,旨在提升AI在复杂软件开发任务中的执行效率与代码质量。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #开源工具 #AI开发平台


🏵 Langfuse - LLM应用全流程管理平台


🍥 简介:
Langfuse 是一款开源的大模型应用开发平台,提供对 LLM 应用的监控、评估与调试功能。系统支持应用逻辑链路追踪、提示词管理、数据集构建及沙盒测试,并兼容 OpenAI、LangChain 及 LlamaIndex 等主流开发框架,通过可视化界面实现对模型性能与响应质量的实时监测与深度优化。


🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #AI工具 #安全测试


🏵 PentAGI - AI自动化渗透测试

🍥 简介:
PentAGI是一款先进的AI驱动工具,专为自动化渗透测试而设计。它通过智能代理,集成并运用Nmap、Metasploit等逾20种专业安全工具。所有操作均在安全的Docker沙箱环境中执行,确保测试过程的隔离性和有效性,从而提升安全评估效率。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #AI工具 #可观测性


🏵 Phoenix - AI可观测性平台

🍥 简介:
Phoenix是一个开源的人工智能可观测性平台。它专为AI模型的实验、评估及故障排除而设计,提供全面的功能集以监控模型性能、分析数据流、识别潜在问题并加速开发迭代。该平台支持数据科学家和机器学习工程师高效管理AI工作流,确保系统稳定运行和优化。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #合规检测 #文档分析 #法律科技 #AI应用


🏵 合规编译器 - 文档法规不合规检测


🍥 简介:
Compliance Compiler是一款开放核心工具,专注于识别文档及司法判决中的形式和法规不合规项。该工具不提供任何法律评估或建议,以确定性、可复现和安全的方式运行。其核心功能包括规范与权限层级分析,并提供可选的AI解析能力,支持用户更换大型语言模型(LLM)提供商。项目提供命令行、Web界面及API多种交互模式,采用AGPL-3.0开源协议。


🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🍭 #AI评测 #机器学习工程


🏵 MLE-bench - AI代理ML工程基准

🍥 简介:
MLE-bench 是专为评估 AI 代理在机器学习工程任务中表现而设计的公开基准工具。它基于真实 Kaggle 竞赛数据集,支持多种任务类型(如图像、文本、表格、音频等),可自动化数据准备、分割、评分和结果统计,便于全面衡量不同智能体在模型开发、数据处理和自动化工程流程上的能力。系统提供标准评测流程、轻量级测试集、自动化评分脚本及丰富的实验配置,适合研究人员、开发者或团队对比和优化 AI 代理在实际 ML 工程场景下的综合能力。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🗣 每日羊毛线报 👈


🏵 Dingo - AI数据质量评估工具

🍥 简介:
Dingo 是一款专业的AI数据质量评估工具,致力于自动化检测数据集中的各类质量问题。它全面支持文本与图像等多模态数据,覆盖从预训练到微调、评测的全流程。该工具融合了基于规则与模型的双重评估体系,内置二十余种通用规则,并集成主流大模型进行幻觉检测与RAG评估。提供CLI和SDK两种调用方式,便于无缝集成到现有工作流中。

🍭 #AI数据质量 #评估工具


🎈 【进入项目】


🎯 关注频道 🤖 合作/投稿
 
 
Back to Top