挖掘有趣 Github 的猫。


有事联系:https://t.me/qumaobot
🍭 #AI工具 #可观测性


🏵 Phoenix - AI可观测性平台

🍥 简介:
Phoenix是一个开源的人工智能可观测性平台。它专为AI模型的实验、评估及故障排除而设计,提供全面的功能集以监控模型性能、分析数据流、识别潜在问题并加速开发迭代。该平台支持数据科学家和机器学习工程师高效管理AI工作流,确保系统稳定运行和优化。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #合规检测 #文档分析 #法律科技 #AI应用


🏵 合规编译器 - 文档法规不合规检测


🍥 简介:
Compliance Compiler是一款开放核心工具,专注于识别文档及司法判决中的形式和法规不合规项。该工具不提供任何法律评估或建议,以确定性、可复现和安全的方式运行。其核心功能包括规范与权限层级分析,并提供可选的AI解析能力,支持用户更换大型语言模型(LLM)提供商。项目提供命令行、Web界面及API多种交互模式,采用AGPL-3.0开源协议。


🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🍭 #AI评测 #机器学习工程


🏵 MLE-bench - AI代理ML工程基准

🍥 简介:
MLE-bench 是专为评估 AI 代理在机器学习工程任务中表现而设计的公开基准工具。它基于真实 Kaggle 竞赛数据集,支持多种任务类型(如图像、文本、表格、音频等),可自动化数据准备、分割、评分和结果统计,便于全面衡量不同智能体在模型开发、数据处理和自动化工程流程上的能力。系统提供标准评测流程、轻量级测试集、自动化评分脚本及丰富的实验配置,适合研究人员、开发者或团队对比和优化 AI 代理在实际 ML 工程场景下的综合能力。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🗣 每日羊毛线报 👈


🏵 Dingo - AI数据质量评估工具

🍥 简介:
Dingo 是一款专业的AI数据质量评估工具,致力于自动化检测数据集中的各类质量问题。它全面支持文本与图像等多模态数据,覆盖从预训练到微调、评测的全流程。该工具融合了基于规则与模型的双重评估体系,内置二十余种通用规则,并集成主流大模型进行幻觉检测与RAG评估。提供CLI和SDK两种调用方式,便于无缝集成到现有工作流中。

🍭 #AI数据质量 #评估工具


🎈 【进入项目】


🎯 关注频道 🤖 合作/投稿
 
 
Back to Top