趣猫🐱 - 挖掘有趣 Github 的猫。有事联系：https://t.me/qumaobot

挖掘有趣 Github 的猫。

有事联系：https://t.me/qumaobot

16:35 · 2026年6月24日 · 周三

🍭 #开源项目 #人工智能 #语音合成

🏵 MOSS-TTS - 高保真语音与音频生成模型

🍥 简介：
MOSS-TTS 是一套开源语音与音频生成模型架构。该程序支持生成高保真音频内容，具备语音克隆、多角色对话交互、实时语音合成以及音效处理等核心功能。系统通过先进的算法实现自然流畅的音频输出，适用于多种语音处理场景，开发者可基于此项目快速部署高质量的语音生成解决方案。

🎈 【进入项目】

🗣 活动线报 | 掘金项目

开源项目人工智能语音合成

05:49 · 2026年6月21日 · 周日

🍭 #开源工具 #语音合成 #本地部署

🏵 Supertonic - 高效本地文本转语音引擎

🍥 简介：
Supertonic 是一款基于 ONNX Runtime 构建的轻量级多语言语音合成系统。该程序专为端侧推理设计，具备极低的资源占用率。系统完全实现本地化运行，无需依赖云端服务器或 API 接口，在确保处理速度的同时，消除了数据传输过程中的隐私泄露风险。

🎈 【进入项目】

🗣 活动线报 | 掘金项目

开源工具语音合成本地部署

16:33 · 2026年6月5日 · 周五

🍭 #开源工具 #语音合成

🏵 Voicebox - 本地化语音克隆与合成工具

🍥 简介：
Voicebox 是一款开源语音合成套件，支持在本地运行以确保数据隐私。该工具具备语音克隆功能，仅需少量音频样本即可生成高保真语音模型。系统内置五种主流文本转语音（TTS）引擎，支持全球 23 种语言，并提供音频特效处理及多音轨时间轴编辑器，能够实现复杂的语音合成与编辑任务，满足各类本地化音频创作需求。

🎈 【进入项目】

🗣 活动线报 | 掘金项目

开源工具语音合成

13:47 · 2026年6月4日 · 周四

🍭 #人工智能 #语音交互 #数字人

🏵 PersonaPlex - 实时全双工语音对话模型

🍥 简介：
PersonaPlex 是一款支持实时全双工语音对话的交互模型。该系统允许用户通过文本提示词与语音指令操控虚拟角色。模型基于合成对话与真实对话语料库训练，具备低延迟响应特性，在实现自然的人机语音交互过程中，能够维持角色设定的一致性与稳定性。

🎈 【进入项目】

🗣 活动线报 | 掘金项目

人工智能语音交互数字人

22:47 · 2026年4月29日 · 周三

🍭 #AI工具 #语音合成

🏵 Free-voice-clone - 免费语音克隆模型库

🍥 简介：
Free-voice-clone 是一个开源集合，收录所有本地部署且免费的开源语音合成模型和音乐生成模型。它提供了多种语音克隆与文本转语音（TTS）技术，以及各类音乐创作算法。该项目为开发者和研究人员汇集了无需商业许可的智能音频处理工具，涵盖多种技术栈和实现方式。

🎈 【进入项目】

🗣 活动线报 | 掘金项目

AI工具语音合成

16:39 · 2026年4月26日 · 周日

🍭 #语音合成 #AI工具

🏵 VoxCPM - 文本合成语音，语音克隆

🍥 简介：
VoxCPM是一款免费开源的语音合成工具。它能将文本转换为逼真的语音，无需令牌使用，并生成富有表现力且符合上下文的音频。该工具仅需3-10秒的音频样本，即可实现高精度语音克隆。

🎈 【进入项目】

🗣 活动线报 | 掘金项目

语音合成 AI工具

01:46 · 2026年4月16日 · 周四

🍭 #语音交互 #虚拟角色

🏵 PersonaPlex - 实时语音控制虚拟角色

🍥 简介：
PersonaPlex是一个实时全双工语音转语音对话模型，旨在通过文本提示和语音命令对虚拟角色进行控制。该模型基于Moshi的架构和权重构建，并结合合成对话与真实对话进行训练。它提供低延迟的自然语音交互能力，同时确保虚拟角色的个性特征保持一致。此系统支持用户以自然语言与角色进行实时互动，适用于需要高度响应和个性化交互的应用场景。

🎈 【进入项目】

🗣 活动线报 | 掘金项目

语音交互虚拟角色

13:32 · 2026年3月7日 · 周六

🍭 #语音合成 #开源工具

🏵 Kugelaudio-open - 开源语音合成与克隆

🍥 简介：
Kugelaudio-open是一个专注于欧洲语言的开源文本转语音项目。它不仅能将文本合成为自然流畅的语音，还支持高级的声音克隆功能。该项目为用户提供灵活且高质量的语音解决方案，适用于各种需要语音合成及个性化声音的应用场景。

🎈 【进入项目】

🗣 活动线报 | 掘金项目

语音合成开源工具

22:47 · 2026年3月6日 · 周五

🍭 #语音合成 #AI工具

🏵 Voicebox - 开源语音合成平台

🍥 简介：
Voicebox是一款开源语音合成工具，支持克隆语音、生成高质量语音内容以及开发语音应用。所有功能均可在本地计算机上运行，提供高效、私密的语音处理解决方案。

🎈 【进入项目】

🗣 活动线报 | 掘金项目

语音合成 AI工具

16:46 · 2026年1月12日 · 周一

🍭 #语音合成 #教学工具

🏵 IMS Toucan - 文本语音合成教学工具

🍥 简介：
IMS Toucan 是一款专为文本转语音（Text-to-Speech, TTS）系统设计的多功能工具集。它旨在帮助用户深入理解、实际操作并高效教授当前先进的语音合成技术。无论是学习者掌握基础原理，开发者实践应用，还是教育者进行专业教学，IMS Toucan 都能提供全面的支持，简化现代语音合成系统的学习与应用过程。

🎈 【进入项目】

🗣 羊毛撸货线报 | 合作/投稿

语音合成教学工具

13:55 · 2025年12月16日 · 周二

🍭 #多模态AI #语音理解

🏵 Step-Audio 2 - 端到端音频理解模型

🍥 简介：
Step-Audio 2是一款工业级端到端多模态大语言模型，专注于音频理解和语音对话。支持高精度ASR语音识别、副语言信息和非语音信息的语义推理。具备情感识别能力，可分析用户年龄、情绪等特征实现智能交互。集成工具调用和多模态RAG技术，通过检索文本和音频知识减少幻觉输出，并支持音色切换。在多项音频理解和对话基准测试中达到业界领先水平，提供mini、mini Base和mini Think三个开源版本，采用Apache 2.0许可协议。

🎈 【进入项目】

🗣 羊毛撸货线报 | 合作/投稿

多模态AI 语音理解

19:50 · 2025年11月11日 · 周二

🍭 #语音合成 #人工智能

🏵 VibeVoice - 长对话语音生成框架

🍥 简介：
VibeVoice是微软推出的前沿开源文本转语音研究框架，专注于生成长篇幅、多说话人的对话式音频。其核心创新在于采用7.5Hz超低帧率的连续语音分词器，通过结合大语言模型的上下文理解能力与扩散模型的声音细节生成技术，实现了长达90分钟、最多4个说话人的高质量语音合成。该框架有效解决了传统TTS系统在扩展性、说话人一致性和自然对话轮换方面的技术挑战，为播客等长音频场景提供了突破性的解决方案。

🎈 【进入项目】

🗣 羊毛撸货线报 | 合作/投稿

语音合成人工智能

20:02 · 2025年9月10日 · 周三

🗣 每日羊毛线报 👈

🏵 Kitten TTS - 轻量级文本转语音

🍥 简介：
Kitten TTS 是一款开源的超轻量级文本转语音（TTS）模型，总参数量仅1500万，模型体积小于25MB。该项目针对CPU环境深度优化，无需GPU即可在各种设备上流畅运行，支持多种高质量语音选择，满足多样化语音合成需求。Kitten TTS 推理速度快，适合实时语音合成场景，便于集成到桌面、移动或嵌入式应用中。适用于开发者对语音质量和资源占用要求严格的应用场合。

🍭 #TTS #语音合成

🎈 【进入项目】

🎯 关注频道 🤖 合作/投稿

TTS 语音合成

20:35 · 2025年5月25日 · 周日

🗣 每日羊毛线报 👈

🏵 KVoiceWalk - Kokoro语音克隆

🍥 简介：
KVoiceWalk 是一款为 Kokoro 文本转语音引擎设计的语音风格克隆应用。它利用随机漫步算法和混合评分方法（结合 Resemblyzer 相似度、特征提取和自相似性）来生成新的 Kokoro 语音风格张量，从而克隆目标声音。该项目旨在探索更高级的遗传算法，验证评分函数和总体概念，为 Kokoro 增加更多语音选项。

🍭 #语音克隆 #文本转语音

🎈 【进入项目】

🎯 关注频道 🤖 合作/投稿

语音克隆文本转语音

20:09 · 2025年3月31日 · 周一

🗣 每日羊毛线报 👈

🏵 Spark-TTS - 高效LLM文本转语音

🍥 简介：
Spark-TTS 是一款基于大型语言模型（LLM）的高效文本转语音（TTS）推理系统。它利用 Qwen2.5 模型，直接从预测的语音代码重建音频，无需额外的声学特征生成模型，简化了流程并提升效率。该项目支持高质量的零样本（Zero-shot）语音克隆，能复制未曾训练过的说话人声音，尤其适用于跨语言和语码转换场景。Spark-TTS 支持中英双语，并允许通过调整参数控制生成语音的特性。

🍭 #文本转语音 #语音合成

🎈 【进入项目】

🎯 关注频道 🤖 合作/投稿

文本转语音语音合成

16:38 · 2023年1月23日 · 周一

🎈 #影视 | 高清时间（hdtime）春节开放注册

🎯 简介：
开放时间：2023-01-20 至 2023-01-25
全站FREE:
2023-01-21 00:00:00 至 2023-01-28 00:00:00（消息源）
#语音合成 #TTS #PC #一点红语音合成 #edge

📍 【进入注册】

🫥 关注频道 ⛳️ 频道说明 🎯 投稿机器人

影视语音合成 TTS PC 一点红语音合成 edge

19:58 · 2023年1月22日 · 周日

🎈 #工具 | 一点红语音合成1.4

🎯 简介：
使用Edge接口合成，将文本按照段落划分200字左右，进行分段合成，合成文件会放到软件temp 文件夹下，最后将所有语音文件自动拼接到一起生成mp3文件，并删除临时文件夹内容。AzureTTS 界面生成的文本自动ssml 标签。（消息源）
#语音合成 #TTS #PC #一点红语音合成 #edge

📍 【进入下载】

🫥 关注频道 ⛳️ 频道说明 🎯 投稿机器人

工具语音合成 TTS PC 一点红语音合成 edge

Home