挖掘有趣 Github 的猫。


有事联系:https://t.me/qumaobot
🍭 #AI #语音助手 #Python

🏵 MadMax - 基于Gemini API的实时AI语音代理

🍥 简介:
MadMax是一款基于Python构建的实时AI语音交互程序,集成Gemini Live API实现语音转文字功能。该项目内置Google搜索接口以获取实时互联网信息,并支持基于Vosk的本地离线语音唤醒。程序具备结构化的JSON长效记忆模块,可存储人物信息、地理位置、个人经历及反思等多维度数据,支持实时通话交互,适用于构建具备持续记忆与动态信息检索能力的智能对话系统。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #AI工具 #语音代理


🏵 Quickvoice_mcp - QuickVoice AI语音代理交互

🍥 简介:
Quickvoice_mcp 是一个专门设计的MCP服务器实现。其核心功能是为QuickVoice AI语音代理提供稳定的交互接口与环境。该程序能够处理与AI语音代理相关的通信协议,确保数据传输的准确性与效率,旨在优化自动化语音系统或集成语音服务的功能扩展和部署。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #语音合成 #教学工具


🏵 IMS Toucan - 文本语音合成教学工具

🍥 简介:
IMS Toucan 是一款专为文本转语音(Text-to-Speech, TTS)系统设计的多功能工具集。它旨在帮助用户深入理解、实际操作并高效教授当前先进的语音合成技术。无论是学习者掌握基础原理,开发者实践应用,还是教育者进行专业教学,IMS Toucan 都能提供全面的支持,简化现代语音合成系统的学习与应用过程。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🗣 每日羊毛线报 👈


🏵 Spark-TTS - 高效LLM文本转语音

🍥 简介:
Spark-TTS 是一款基于大型语言模型(LLM)的高效文本转语音(TTS)推理系统。它利用 Qwen2.5 模型,直接从预测的语音代码重建音频,无需额外的声学特征生成模型,简化了流程并提升效率。该项目支持高质量的零样本(Zero-shot)语音克隆,能复制未曾训练过的说话人声音,尤其适用于跨语言和语码转换场景。Spark-TTS 支持中英双语,并允许通过调整参数控制生成语音的特性。

🍭 #文本转语音 #语音合成


🎈 【进入项目】


🎯 关注频道 🤖 合作/投稿
 
 
Back to Top