挖掘有趣 Github 的猫。


有事联系:https://t.me/qumaobot
🍭 #语音识别 #AI模型


🏵 Fun-ASR - 智能语音识别

🍥 简介:
Fun-ASR 是由通义实验室研发的综合语音识别模型。该模型基于数千万小时真实语音数据进行训练,具备强大的上下文理解能力与行业适应性,旨在提供高性能的语音识别解决方案。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #AI工具 #视频生成


🏵 LivePortrait - AI静态照片动画

🍥 简介:
LivePortrait是一款人工智能工具,可将静态照片动画化为视频。其工作原理是通过识别关键面部特征,并生成逼真的动态效果。该技术旨在将平面图像赋予生命力,提供一种高效的视频内容生成方案。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #手写识别 #AI工具


🏵 InkSight - 手写文本数字化

🍥 简介:
InkSight是一个将离线手写文本转换为在线数字格式的系统。它利用Vision Transformer(ViT)架构和mT5编解码器,将手写照片数字化。该系统通过结合读写算法进行多任务学习,无需专用硬件即可处理手写内容,并能适应不同的书写风格和笔迹特征。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #自托管 #照片视频备份 #AI图像处理


🏵 Immich - 自托管照片视频备份

🍥 简介:
Immich是一款开源的自托管照片和视频备份解决方案,旨在提供与主流云服务相似的功能,同时确保用户对其个人媒体数据拥有完全控制权。它能自动上传、整理、搜索及分类媒体文件,并集成高级AI功能如人脸识别,通过分析元数据进行智能管理。该系统尤其适用于关注数据隐私、寻求自主管理其数字影像档案的个人及组织。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #AI工具 #可观测性


🏵 Phoenix - AI可观测性平台

🍥 简介:
Phoenix是一个开源的人工智能可观测性平台。它专为AI模型的实验、评估及故障排除而设计,提供全面的功能集以监控模型性能、分析数据流、识别潜在问题并加速开发迭代。该平台支持数据科学家和机器学习工程师高效管理AI工作流,确保系统稳定运行和优化。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #无障碍辅助 #设计工具 #色彩检测 #AI应用


🏵 Smart Color Contrast Assistant - AI驱动WCAG对比度检查

🍥 简介:
AI驱动的WCAG对比度检测工具,可识别并推荐符合AA/AAA标准(含常规及大文本)的替代颜色。结果按Delta E CIEDE2000感知色差排序。助团队高效解决色彩无障碍,同时保持品牌一致性。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🍭 #文档解析 #AI识别


🏵 Dots.ocr - 文档智能解析

🍥 简介:
Dots.ocr是一款多语言文档解析器。它将版面识别与内容解析整合至统一的“视觉-语言”模型,并能保持自然的阅读顺序。该程序基于紧凑型17亿参数语言模型,却能提供最先进(SOTA)的性能表现。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🍭 #AI工具 #屏幕识别 #效率助手

🏵 Everywhere - AI屏幕识别助手

🍥 简介:
Everywhere是一款交互式AI助手,具备上下文识别能力、现代化界面及集成功能。该工具区别于传统AI,能即时识别并理解屏幕上显示的所有内容。用户无需截屏、复制或切换应用,只需通过快捷键即可在当前操作界面直接获取AI辅助,实现高效的信息处理与任务支持。

🎈 【进入项目】

🗣 羊毛撸货线报 | 合作/投稿
🍭 #合规检测 #文档分析 #法律科技 #AI应用


🏵 合规编译器 - 文档法规不合规检测


🍥 简介:
Compliance Compiler是一款开放核心工具,专注于识别文档及司法判决中的形式和法规不合规项。该工具不提供任何法律评估或建议,以确定性、可复现和安全的方式运行。其核心功能包括规范与权限层级分析,并提供可选的AI解析能力,支持用户更换大型语言模型(LLM)提供商。项目提供命令行、Web界面及API多种交互模式,采用AGPL-3.0开源协议。


🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🍭 #PDF工具 #AI模型 #表单识别 #自动化处理


🏵 CommonForms - PDF表单字段自动识别

🍥 简介:
CommonForms 提供一系列开源模型,专用于实现PDF表单中字段的自动化识别。通过这些预训练模型,用户能够高效、准确地解析各类PDF文档,自动提取表单元素,极大提升了数据处理与信息录入的自动化水平。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🍭 #AI工具 #语音识别 #资源列表


🏵 Awesome-whisper - Whisper AI语音识别资源集

🍥 简介:
此列表汇集了OpenAI开源的AI语音识别系统Whisper的各类相关资源。Whisper是一款基于人工智能的先进语音识别模型,能够高效准确地将人类语音转换为文本。该项目旨在提供一个精选资源集合,便于开发者和研究人员快速了解并利用Whisper的功能,涵盖工具、库、教程及应用案例,旨在促进Whisper技术社区的交流与发展。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🍭 #姿态识别 #AI #无线传感 #隐私保护


🏵 Wifi-densepose - Wi-Fi人体姿态识别

🍥 简介:
Wifi-densepose是一款先进的Wi-Fi人体姿态识别系统,利用信道状态信息(CSI)与机器学习技术,无需摄像头即可实时识别和跟踪人体姿态。系统支持多达10人同时跟踪,实现低于50毫秒的延迟与每秒30帧的姿态评估。该系统强调隐私保护,适用于健康、健身、智能家居及安全等场景,并提供企业级API接口。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🍭 #AI伴侣 #虚拟角色


🏵 Project AIRI - 数字虚拟伴侣平台

🍥 简介:
Project AIRI 是一款自托管的开源数字伴侣平台,致力于为用户打造可交流、可互动、可游戏的虚拟AI角色。AIRI 支持实时语音聊天、Minecraft与Factorio等游戏互动,并兼容Web、macOS和Windows多平台。系统集成了RAG记忆系统、嵌入式数据库、Live2D与VRM模型动画,具备自然语言理解、语音识别与合成等AI能力。用户可自由定制、扩展插件,实现个性化虚拟伙伴体验,适用于开发者和AI爱好者探索数字生命及人机互动新方式。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🍭 #AI助手 #移动自动化


🏵 mobile-use - 手机智能自动控制

🍥 简介:
mobile-use 是一款开源的 AI 智能代理,支持通过自然语言直接操控 Android 或 iOS 设备。用户只需用日常语言下达指令,mobile-use 就能自动识别并模拟人在手机上的操作,如发送消息、浏览应用、提取数据等。系统具备界面感知能力,能够智能导航各类手机应用,实现自动化任务。支持灵活配置不同大语言模型,满足个性化需求,适合开发者、自动化爱好者和需要提升手机操作效率的用户。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🍭 #AI自动化 #移动端工具


🏵 mobile-use - 手机智能自动化助手

🍥 简介:
mobile-use 是一款开源 AI 智能代理工具,支持通过自然语言控制 Android 和 iOS 设备,实现自动化操作和数据提取。用户只需用日常语言下达指令,系统即可模拟真实用户操作,完成消息发送、应用导航、信息抓取等任务。工具具备强大的 UI 识别、数据结构化输出和多模型底层扩展能力,适配真机和模拟器,支持多种主流 LLM。适用于移动端自动化、数据采集和智能助手开发场景,极大提升手机操作效率。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🗣 每日羊毛线报 👈


🏵 Claude Code IDE for Emacs - Emacs智能AI集成

🍥 简介:
Claude Code IDE for Emacs 是一款深度集成Claude Code CLI的Emacs扩展,基于MCP协议实现双向通信,将Claude智能助手无缝嵌入Emacs开发环境。插件支持自动项目识别、多会话管理、终端集成、代码诊断(Flycheck/Flymake)、语法树分析(tree-sitter)、代码导航(LSP/xref)及自定义Elisp命令调用。用户可通过菜单、快捷键高效与Claude交互,实现项目上下文感知、代码选择处理与差异比对,显著提升Emacs开发智能化与自动化水平。

🍭 #Emacs插件 #AI编程助手


🎈 【进入项目】


🎯 关注频道 🤖 合作/投稿
🗣 每日羊毛线报 👈


🏵 Claude-Flow - AI开发流程编排平台

🍥 简介:
Claude-Flow v2 Alpha 是一个企业级的 AI 编排平台,旨在革新 AI 开发方式。它融合了蜂群智能、神经网络模式识别和 87 个高级 MCP 工具,实现前所未有的 AI 驱动开发工作流。核心功能包括:蜂群智能协调、神经网络加速、动态Agent架构、SQLite 记忆系统以及 GitHub 集成。

🍭 #AI编排 #蜂群智能


🎈 【进入项目】


🎯 关注频道 🤖 合作/投稿
🗣 每日羊毛线报 👈


🏵 Lingo.dev - AI驱动的i18n工具

🍥 简介:
Lingo. dev 是一款开源、AI 驱动的国际化(i18n)工具包,利用大型语言模型(LLM)实现快速本地化。其编译器中间件可在构建时使 React 应用支持多语言,无需修改现有组件。它与 Next.js、Vite 和 React Router 集成,通过处理 React 代码的 AST,识别可翻译内容,并嵌入翻译结果。

🍭 #i18n #本地化 #AI


🎈 【进入项目】


🎯 关注频道 🤖 合作/投稿
🗣 每日薅羊毛线报 👈


🏵 Paper2GUI - AI工具集成平台

🍥 简介:
Paper2GUI,一款集成多种AI模型的桌面应用工具箱,旨在简化人工智能技术的使用。支持40+ AI模型,包括但不限于AI绘画、语音合成、视频补帧、视频超分、目标检测、图片风格化、OCR识别等。无需安装,兼容Windows、Mac、Linux系统,为用户提供一站式AI解决方案。

🪝 #Paper2GUI #AI


🎈 【进入项目】


🎯 关注频道 🤖 合作/投稿
#Epivolis #AI #chatgpt #LLM


🏵 #网站 | Epivolis - LLM安全过滤器

🍥 简介:
Epivolis是一个内容过滤器,可以防止大型语言模型(LLM)被恶意输入或输出所泄露或损坏。它作为一个API中间层,可以在你的LLM和用户之间提供一层安全保障。
Epivolis利用了最新的自然语言理解技术,来识别和过滤掉任何可能包含反向提示工程或提示注入攻击的输入或输出,帮助你保护你的LLM的知识、隐私和质量。


🎈 【进入网站】


🫥 关注频道 🤖 合作/投稿
 
 
Back to Top