挖掘有趣 Github 的猫。


有事联系:https://t.me/qumaobot
🍭 #人工智能 #前端开发


🏵 Transformers.js - 浏览器端运行机器学习模型


🍥 简介:
该库支持在浏览器环境中直接运行深度学习模型,无需后端服务器即可实现自然语言处理任务。开发者可利用其执行文本分类、翻译、摘要生成及问答等功能,通过Web标准API实现高性能的离线推理,简化前端集成复杂AI模型的开发流程。


🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #MCP #人工智能 #开发工具


🏵 Context Mode - AI代码工具上下文优化


🍥 简介:
Context Mode 是一款 MCP 服务器,旨在解决 AI 编码工具的上下文窗口超限问题。该程序将原始数据(如大体积日志或快照)存储在外部沙盒中,通过高效压缩技术(如将 315 KB 压缩至 5.4 KB,缩减率 98%)显著优化处理效率。利用 SQLite 管理会话,支持在数据清理后无缝恢复,并强制 AI 模型生成用于数据分析的代码,而非直接导出原始数据。


🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #人工智能 #机器学习 #自动化编程


🏵 ML Intern - 自动化机器学习代码研发与部署


🍥 简介:
ML Intern 是一款基于 Hugging Face 生态构建的自主 AI 智能体。该程序能够自动执行机器学习任务,涵盖文献调研、代码编写及模型部署。它深度集成 Hugging Face 的工具链、技术文档、数据集及云端资源,旨在实现从算法开发到生产环境部署的全流程自动化作业,有效提升工程研发效率。


🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #人工智能 #自动化工具 #办公效率


🏵 GenericAgent - AI全自动桌面操作控制系统

🍥 简介:
GenericAgent 是一款基于轻量级代码库构建的 AI 代理框架,包含约 3000 行核心代码。该系统通过 9 种基础工具实现对计算机桌面的全方位控制,涵盖浏览器交互、文件管理、鼠标操作及屏幕录制等功能。它支持任务自动化执行,可将外卖订购、股价监测、即时通讯等操作转化为可复用的技能模型,通过自主学习机制构建个性化技能树,从而提升复杂任务的处理效率。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #人工智能 #文件识别

🏵 Magika - 高精度AI文件类型识别工具

🍥 简介:
Magika是Google开发的AI文件识别工具,支持识别超过200种文件格式,准确率高达99%。该程序内置轻量化模型,在单核处理器上即可实现毫秒级响应。支持通过pip、brew或脚本安装,兼容命令行界面(CLI)、Python、JavaScript及Go语言调用。具备递归扫描、多格式输出(如JSON)等功能,适用于各类文件、目录及数据流的自动化鉴定任务。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #人工智能 #语音交互 #数字人

🏵 PersonaPlex - 实时全双工语音对话模型

🍥 简介:
PersonaPlex 是一款支持实时全双工语音对话的交互模型。该系统允许用户通过文本提示词与语音指令操控虚拟角色。模型基于合成对话与真实对话语料库训练,具备低延迟响应特性,在实现自然的人机语音交互过程中,能够维持角色设定的一致性与稳定性。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #搜索工具 #Markdown #人工智能

🏵 QMD - 本地化Markdown文档智能检索系统

🍥 简介:
QMD是一款运行于本地的搜索系统,专为Markdown笔记、会议纪要、技术文档及知识库设计。该程序通过内置的本地AI模型,实现关键词匹配、语义理解及混合检索功能。所有数据处理均在本地终端完成,无需连接互联网,确保了敏感文档的隐私安全与检索的高效性。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #人工智能 #边缘计算 #离线模型


🏵 Google AI Edge - 手机端本地化AI运行平台

🍥 简介:
该平台支持在移动设备上离线运行Gemma等开源高性能AI模型,无需联网即可实现智能代理、图像分析、语音转录及请求测试等功能。所有处理流程均在设备本地完成,确保用户数据隐私安全,同时提供高效的响应速度与离线交互能力。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #OCR #人工智能 #文档识别


🏵 GLM-OCR - 高精度复杂文档OCR识别模型


🍥 简介:
GLM-OCR是一款拥有9亿参数的文档识别模型。该模型针对表格、代码、数学公式、印章及票据等复杂文档场景进行了深度优化,在OmniDocBench V1.5基准测试中取得了94.62的高分,能够精准提取复杂排版中的关键文本信息。


🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #人工智能 #科研自动化 #大模型应用


🏵 AI Scientist-v2 - 全自动科学论文生成系统


🍥 简介:
该系统作为自主型人工智能代理,通过代理树搜索技术,自动化执行从构思科学课题、开展实验分析到撰写完整学术论文的全流程。系统无需人工模板介入,具备独立生成高质量科研成果的能力,且其产出的论文已成功通过ICLR工作坊的同行评审,实现了科研论文自动化生成的实质性进展。


🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #OCR #人工智能 #文档处理


🏵 Chandra OCR 2 - 多格式高精度文档识别模型

🍥 简介:
Chandra OCR 2 是一款先进的识别模型,支持将图像及 PDF 文档转换为结构化的 Markdown、HTML 或 JSON 格式。该模型在保持复杂排版、表格、数学公式及手写文本完整性的同时,提供超过 90 种语言的高精度识别。其在 olmOCR 等多项行业基准测试中表现优异,综合识别准确率处于领先水平。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #人工智能 #语音识别


🏵 Insanely Fast Whisper - 高性能语音转文字工具

🍥 简介:
该工具基于命令行运行,旨在实现音频文件的高速转录。软件深度集成OpenAI Whisper Large v3模型,并针对NVIDIA显卡及Mac平台进行了深度优化。通过应用Flash Attention等技术,显著提升了处理效率与推理速度,适用于对语音识别实时性要求较高的计算场景,是实现大规模音频自动转写的高效方案。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #人工智能 #机器学习


🏵 Hugging Face Skills - AI/ML任务定义

🍥 简介:
Hugging Face Skills 定义了人工智能和机器学习任务,涵盖数据集创建、模型训练和评估。它兼容主流编程工具,包括OpenAI Codex、Anthropic Claude Code、Google DeepMind Gemini CLI和Cursor。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #渗透测试 #人工智能


🏵 METATRON - AI驱动的渗透测试助手

🍥 简介:
METATRON是一款专为Linux操作系统(特别是Parrot OS)设计的渗透测试辅助工具。它通过集成先进的人工智能技术与本地语言模型,旨在为网络安全专业人员提供高效、智能的漏洞评估与利用支持。该工具能够自动化部分测试流程,提供深度分析见解,从而显著提升渗透测试工作的效率与准确性。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #人工智能 #开源工具


🏵 Cognee - AI记忆引擎

🍥 简介:
Cognee是一款开源AI记忆引擎,旨在优化AI系统的数据理解与处理能力。它通过模拟人类认知过程,从文本和图像等多种数据类型中构建“记忆”,以提升大型语言模型(LLM)的准确性,并使其能够回顾过往交互及文档。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #人工智能 #网络安全


🏵 GHOSTCREW - AI渗透测试助手

🍥 简介:
GHOSTCREW是一款基于人工智能的渗透测试辅助工具。它融合大型语言模型,并采用MCP与RAG架构,使用户能够通过自然语言执行渗透测试任务、查询安全信息并分析网络流量。该工具旨在简化并优化网络安全操作流程。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #人工智能 #LLM #提示词工程 #自动化

🏵 Promptomatix - LLM提示词自动化与优化

🍥 简介:
Promptomatix 是一个专为大型语言模型(LLM)设计的AI驱动平台,专注于提示词的自动化生成与优化。该平台提供结构化方法,旨在提升提示词的质量、一致性及成本效益。通过自动化流程,Promptomatix有效减少了传统手动提示词工程中耗时且易错的迭代过程,从而帮助开发者及研究人员高效产出高质量的LLM交互内容,加速应用开发与部署。

🎈 【进入项目】

🗣 羊毛撸货线报 | 合作/投稿
🍭 #语音合成 #人工智能


🏵 VibeVoice - 长对话语音生成框架

🍥 简介:
VibeVoice是微软推出的前沿开源文本转语音研究框架,专注于生成长篇幅、多说话人的对话式音频。其核心创新在于采用7.5Hz超低帧率的连续语音分词器,通过结合大语言模型的上下文理解能力与扩散模型的声音细节生成技术,实现了长达90分钟、最多4个说话人的高质量语音合成。该框架有效解决了传统TTS系统在扩展性、说话人一致性和自然对话轮换方面的技术挑战,为播客等长音频场景提供了突破性的解决方案。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🍭 #智能体 #人机交互


🏵 OpenCUA - 开源电脑操作智能体框架

🍥 简介:
OpenCUA 是一个面向电脑操作智能体的大型开源基础框架,专注于构建和训练能自主执行多系统、多应用任务的智能体模型。核心包括大规模人机交互数据集、自动化标注工具、离线评测平台和端到端行动模型,支持Windows、macOS和Ubuntu。OpenCUA 能捕捉屏幕、操作行为并生成可解释的思考链,具备强大的环境感知和任务规划能力,广泛用于智能体研究、桌面自动化和AI交互系统开发,是推动AI与实际应用结合的重要基础设施。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🍭 #人工智能 #实时监控


🏵 BirdNET-Go - 实时鸟类声音识别

🍥 简介:
BirdNET-Go 是一款基于 AI 的鸟类声音实时分析工具,支持全天候连续监测和识别。它利用 BirdNET 训练的深度学习模型,能本地识别6500多种鸟类,无需联网即可运行。支持多种操作系统,包括 Windows、Linux 和 macOS,同时适配树莓派等低功耗设备。内置可视化网页界面,支持日志、SQLite 和 MySQL 数据输出,并可集成 Prometheus 指标和 BirdWeather API。适合生态监测、科研和直播场景下的自动化鸟类识别需求。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
 
 
Back to Top