挖掘有趣 Github 的猫。


有事联系:https://t.me/qumaobot
🍭 #人工智能 #语音交互 #数字人

🏵 PersonaPlex - 实时全双工语音对话模型

🍥 简介:
PersonaPlex 是一款支持实时全双工语音对话的交互模型。该系统允许用户通过文本提示词与语音指令操控虚拟角色。模型基于合成对话与真实对话语料库训练,具备低延迟响应特性,在实现自然的人机语音交互过程中,能够维持角色设定的一致性与稳定性。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #AI #语音助手 #Python

🏵 MadMax - 基于Gemini API的实时AI语音代理

🍥 简介:
MadMax是一款基于Python构建的实时AI语音交互程序,集成Gemini Live API实现语音转文字功能。该项目内置Google搜索接口以获取实时互联网信息,并支持基于Vosk的本地离线语音唤醒。程序具备结构化的JSON长效记忆模块,可存储人物信息、地理位置、个人经历及反思等多维度数据,支持实时通话交互,适用于构建具备持续记忆与动态信息检索能力的智能对话系统。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #AI工具 #语音代理


🏵 Quickvoice_mcp - QuickVoice AI语音代理交互

🍥 简介:
Quickvoice_mcp 是一个专门设计的MCP服务器实现。其核心功能是为QuickVoice AI语音代理提供稳定的交互接口与环境。该程序能够处理与AI语音代理相关的通信协议,确保数据传输的准确性与效率,旨在优化自动化语音系统或集成语音服务的功能扩展和部署。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #JavaScript库 #语音识别

🏵 Annyang - JavaScript语音识别库

🍥 简介:
Annyang是一个轻量级JavaScript语音识别库,使用户能通过语音指令操控网页。它无需额外依赖,体积仅2KB,遵循MIT许可证免费分发,提供高效的语音交互功能。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #AI #语音助手


🏵 Jarvis - 本地离线AI语音助手

🍥 简介:
Jarvis是一款100%私人化的AI语音助手,运行于本地计算机且支持离线工作。它提供对话式交互,具备记忆能力,并能感知用户位置与时间。核心功能包括在线信息查询、Chrome浏览器控制及饮食追踪等。支持无限量模块扩展,确保多工具集成时上下文连续。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #AI工具 #语音技术


🏵 Moonshine Voice - 语音助手开发

🍥 简介:
Moonshine Voice是一个开源项目,专注于提供低延迟的语音转文本、意图识别及文本转语音能力。它旨在简化语音助手和交互界面的开发流程,为构建高效、响应迅速的语音交互系统提供核心技术支持,广泛应用于各类智能设备与应用。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #游戏模组 #语音交互


🏵 Mantella - NPC自然语音交互模组

🍥 简介:
Mantella 是一款专为《上古卷轴5:天际》和《辐射4》设计的游戏模组。该模组集成了语音转文本(如 Moonshine、Whisper)、大型语言模型及文本转语音技术(如 Piper、xVASynth、XTTS),旨在使玩家能够与非玩家角色(NPC)进行自然语言交互。通过此技术栈,Mantella 实现了从玩家语音输入到NPC响应语音输出的完整对话流程,提升了游戏内角色互动的真实性和效率。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #语音交互 #虚拟角色


🏵 PersonaPlex - 实时语音控制虚拟角色

🍥 简介:
PersonaPlex是一个实时全双工语音转语音对话模型,旨在通过文本提示和语音命令对虚拟角色进行控制。该模型基于Moshi的架构和权重构建,并结合合成对话与真实对话进行训练。它提供低延迟的自然语音交互能力,同时确保虚拟角色的个性特征保持一致。此系统支持用户以自然语言与角色进行实时互动,适用于需要高度响应和个性化交互的应用场景。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #多模态AI #语音理解


🏵 Step-Audio 2 - 端到端音频理解模型

🍥 简介:
Step-Audio 2是一款工业级端到端多模态大语言模型,专注于音频理解和语音对话。支持高精度ASR语音识别、副语言信息和非语音信息的语义推理。具备情感识别能力,可分析用户年龄、情绪等特征实现智能交互。集成工具调用和多模态RAG技术,通过检索文本和音频知识减少幻觉输出,并支持音色切换。在多项音频理解和对话基准测试中达到业界领先水平,提供mini、mini Base和mini Think三个开源版本,采用Apache 2.0许可协议。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
 
 
Back to Top