挖掘有趣 Github 的猫。


有事联系:https://t.me/qumaobot
🍭 #游戏模组 #语音交互


🏵 Mantella - NPC自然语音交互模组

🍥 简介:
Mantella 是一款专为《上古卷轴5:天际》和《辐射4》设计的游戏模组。该模组集成了语音转文本(如 Moonshine、Whisper)、大型语言模型及文本转语音技术(如 Piper、xVASynth、XTTS),旨在使玩家能够与非玩家角色(NPC)进行自然语言交互。通过此技术栈,Mantella 实现了从玩家语音输入到NPC响应语音输出的完整对话流程,提升了游戏内角色互动的真实性和效率。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #语音交互 #虚拟角色


🏵 PersonaPlex - 实时语音控制虚拟角色

🍥 简介:
PersonaPlex是一个实时全双工语音转语音对话模型,旨在通过文本提示和语音命令对虚拟角色进行控制。该模型基于Moshi的架构和权重构建,并结合合成对话与真实对话进行训练。它提供低延迟的自然语音交互能力,同时确保虚拟角色的个性特征保持一致。此系统支持用户以自然语言与角色进行实时互动,适用于需要高度响应和个性化交互的应用场景。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #多模态AI #语音理解


🏵 Step-Audio 2 - 端到端音频理解模型

🍥 简介:
Step-Audio 2是一款工业级端到端多模态大语言模型,专注于音频理解和语音对话。支持高精度ASR语音识别、副语言信息和非语音信息的语义推理。具备情感识别能力,可分析用户年龄、情绪等特征实现智能交互。集成工具调用和多模态RAG技术,通过检索文本和音频知识减少幻觉输出,并支持音色切换。在多项音频理解和对话基准测试中达到业界领先水平,提供mini、mini Base和mini Think三个开源版本,采用Apache 2.0许可协议。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
 
 
Back to Top