挖掘有趣 Github 的猫。


有事联系:https://t.me/qumaobot
🍭 #AI工具 #语音合成


🏵 Free-voice-clone - 免费语音克隆模型库

🍥 简介:
Free-voice-clone 是一个开源集合,收录所有本地部署且免费的开源语音合成模型和音乐生成模型。它提供了多种语音克隆与文本转语音(TTS)技术,以及各类音乐创作算法。该项目为开发者和研究人员汇集了无需商业许可的智能音频处理工具,涵盖多种技术栈和实现方式。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #语音合成 #AI工具


🏵 VoxCPM - 文本合成语音,语音克隆

🍥 简介:
VoxCPM是一款免费开源的语音合成工具。它能将文本转换为逼真的语音,无需令牌使用,并生成富有表现力且符合上下文的音频。该工具仅需3-10秒的音频样本,即可实现高精度语音克隆。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #语音交互 #虚拟角色


🏵 PersonaPlex - 实时语音控制虚拟角色

🍥 简介:
PersonaPlex是一个实时全双工语音转语音对话模型,旨在通过文本提示和语音命令对虚拟角色进行控制。该模型基于Moshi的架构和权重构建,并结合合成对话与真实对话进行训练。它提供低延迟的自然语音交互能力,同时确保虚拟角色的个性特征保持一致。此系统支持用户以自然语言与角色进行实时互动,适用于需要高度响应和个性化交互的应用场景。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #语音合成 #开源工具

🏵 Kugelaudio-open - 开源语音合成与克隆

🍥 简介:
Kugelaudio-open是一个专注于欧洲语言的开源文本转语音项目。它不仅能将文本合成为自然流畅的语音,还支持高级的声音克隆功能。该项目为用户提供灵活且高质量的语音解决方案,适用于各种需要语音合成及个性化声音的应用场景。

🎈 【进入项目】

🗣 活动线报 | 掘金项目
🍭 #语音合成 #AI工具

🏵 Voicebox - 开源语音合成平台

🍥 简介:
Voicebox是一款开源语音合成工具,支持克隆语音、生成高质量语音内容以及开发语音应用。所有功能均可在本地计算机上运行,提供高效、私密的语音处理解决方案。

🎈 【进入项目】

🗣 活动线报 | 掘金项目
🍭 #语音合成 #教学工具


🏵 IMS Toucan - 文本语音合成教学工具

🍥 简介:
IMS Toucan 是一款专为文本转语音(Text-to-Speech, TTS)系统设计的多功能工具集。它旨在帮助用户深入理解、实际操作并高效教授当前先进的语音合成技术。无论是学习者掌握基础原理,开发者实践应用,还是教育者进行专业教学,IMS Toucan 都能提供全面的支持,简化现代语音合成系统的学习与应用过程。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🍭 #多模态AI #语音理解


🏵 Step-Audio 2 - 端到端音频理解模型

🍥 简介:
Step-Audio 2是一款工业级端到端多模态大语言模型,专注于音频理解和语音对话。支持高精度ASR语音识别、副语言信息和非语音信息的语义推理。具备情感识别能力,可分析用户年龄、情绪等特征实现智能交互。集成工具调用和多模态RAG技术,通过检索文本和音频知识减少幻觉输出,并支持音色切换。在多项音频理解和对话基准测试中达到业界领先水平,提供mini、mini Base和mini Think三个开源版本,采用Apache 2.0许可协议。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🍭 #语音合成 #人工智能


🏵 VibeVoice - 长对话语音生成框架

🍥 简介:
VibeVoice是微软推出的前沿开源文本转语音研究框架,专注于生成长篇幅、多说话人的对话式音频。其核心创新在于采用7.5Hz超低帧率的连续语音分词器,通过结合大语言模型的上下文理解能力与扩散模型的声音细节生成技术,实现了长达90分钟、最多4个说话人的高质量语音合成。该框架有效解决了传统TTS系统在扩展性、说话人一致性和自然对话轮换方面的技术挑战,为播客等长音频场景提供了突破性的解决方案。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🗣 每日羊毛线报 👈


🏵 Kitten TTS - 轻量级文本转语音

🍥 简介:
Kitten TTS 是一款开源的超轻量级文本转语音(TTS)模型,总参数量仅1500万,模型体积小于25MB。该项目针对CPU环境深度优化,无需GPU即可在各种设备上流畅运行,支持多种高质量语音选择,满足多样化语音合成需求。Kitten TTS 推理速度快,适合实时语音合成场景,便于集成到桌面、移动或嵌入式应用中。适用于开发者对语音质量和资源占用要求严格的应用场合。

🍭 #TTS #语音合成


🎈 【进入项目】


🎯 关注频道 🤖 合作/投稿
🗣 每日羊毛线报 👈


🏵 KVoiceWalk - Kokoro语音克隆

🍥 简介:
KVoiceWalk 是一款为 Kokoro 文本转语音引擎设计的语音风格克隆应用。它利用随机漫步算法和混合评分方法(结合 Resemblyzer 相似度、特征提取和自相似性)来生成新的 Kokoro 语音风格张量,从而克隆目标声音。该项目旨在探索更高级的遗传算法,验证评分函数和总体概念,为 Kokoro 增加更多语音选项。

🍭 #语音克隆 #文本转语音


🎈 【进入项目】


🎯 关注频道 🤖 合作/投稿
🗣 每日羊毛线报 👈


🏵 Spark-TTS - 高效LLM文本转语音

🍥 简介:
Spark-TTS 是一款基于大型语言模型(LLM)的高效文本转语音(TTS)推理系统。它利用 Qwen2.5 模型,直接从预测的语音代码重建音频,无需额外的声学特征生成模型,简化了流程并提升效率。该项目支持高质量的零样本(Zero-shot)语音克隆,能复制未曾训练过的说话人声音,尤其适用于跨语言和语码转换场景。Spark-TTS 支持中英双语,并允许通过调整参数控制生成语音的特性。

🍭 #文本转语音 #语音合成


🎈 【进入项目】


🎯 关注频道 🤖 合作/投稿
🎈 #影视 | 高清时间(hdtime)春节开放注册

🎯 简介:
开放时间:2023-01-20 至 2023-01-25
全站FREE:
2023-01-21 00:00:00 至 2023-01-28 00:00:00(消息源
#语音合成 #TTS #PC #一点红语音合成 #edge

📍 【进入注册】


🫥 关注频道 ⛳️ 频道说明 🎯 投稿机器人
🎈 #工具 | 一点红语音合成1.4

🎯 简介:
使用Edge接口合成,将文本按照段落划分200字左右,进行分段合成,合成文件会放到软件temp 文件夹下,最后将所有语音文件自动拼接到一起生成mp3文件,并删除临时文件夹内容。AzureTTS 界面生成的文本 自动ssml 标签。(消息源
#语音合成 #TTS #PC #一点红语音合成 #edge

📍 【进入下载】


🫥 关注频道 ⛳️ 频道说明 🎯 投稿机器人
 
 
Back to Top