挖掘有趣 Github 的猫。


有事联系:https://t.me/qumaobot
🍭 #文档处理 #AI工具


🏵 Paper2Any - 文档内容转多种格式

🍥 简介:
Paper2Any 是一款多功能文档处理软件,旨在将各类 PDF 格式的文章、图像或纯文本内容,通过一键操作,高效转换为多种可编辑的输出形式,如详细图表、技术路线图、实验数据图、PowerPoint 演示文稿等。其核心组件包括 Paper2Figure,专门用于生成科学研究的可视化图形;Paper2PPT,能够根据需求创建定制化的演示文稿,并精准提取表格数据;PDF2PPT,确保在转换过程中完美保留原始 PDF 的页面布局;同时,该软件还集成了人工智能技术,以进一步优化和增强设计效果。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #AI工具 #文档转换


🏵 Paper2Slides - 自动化幻灯片生成

🍥 简介:
Paper2Slides是一款为学术和专业用户设计的自动化工具。它利用先进技术,能够迅速将各类文本资料,包括科学论文、研究报告和技术文档等,智能转换为具备专业排版和视觉效果的演示幻灯片及海报。该系统旨在大幅简化传统的手动制作流程,显著提升用户内容准备的效率,同时确保最终输出材料的专业品质和视觉呈现力,满足高效沟通与展示的需求。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #文档生成 #前端工具

🏵 Htmldocs - React本地文档PDF生成

🍥 简介:
Htmldocs是一个基于React的本地文档编辑器及预览服务器。它通过HTML和CSS技术栈,高效生成PDF文件,融合LaTeX结构优势与前端开发便捷性。开发者可利用JSX创建动态文档模板,仅通过数据即可生成发票、报告等PDF。工具支持最新CSS特性,提供组件集,并全面兼容TypeScript。

🎈 【进入项目】

🗣 羊毛撸货线报 | 合作/投稿
🍭 #AI工具 #音频生成 #文档转换 #播客工具


🏵 Doc2Podcast - PDF文档转播客音频

🍥 简介:
Doc2Podcast是一款基于人工智能的工具,旨在将PDF文档内容转换为播客格式的音频。该项目利用Next.js、React和Langflow技术栈,实现从文本文档到音频内容的自动生成与输出。其核心功能是自动化文档的音频化处理。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🍭 #文本转语音 #内容创作


🏵 Abogen - 文本转语音工具

🍥 简介:
Abogen是一款强大高效的文本转语音工具。它能将ePub、PDF、TXT、Markdown或字幕文件迅速转为高质量音频,同时生成配套字幕。借助Kokoro-82M模型,提供自然流畅的语音输出,广泛适用于制作有声读物、社媒配音,及各类文本转语音项目。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🍭 #文本转语音 #电子书处理


🏵 Audiblez - 电子书转有声书

🍥 简介:
Audiblez是一款基于Kokoro-82M语音合成模型的开源工具,可将EPUB电子书转换为高质量的M4B有声书。该工具支持中英日等9种语言,提供图形界面和命令行两种操作方式,支持CUDA加速提升生成效率。通过集成espeak-ng文本预处理和ffmpeg音频处理,可实现章节分割、语速调节等实用功能,帮助用户快速将文字内容转换为自然流畅的语音作品。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🍭 #深度学习 #文本生成


🏵 gpt-fast - 高效PyTorch文本生成

🍥 简介:
gpt-fast 是一款基于 PyTorch 的极简高效 Transformer 文本生成工具,核心代码不足1000行,仅依赖 PyTorch 和 sentencepiece,无需额外复杂依赖。支持 int8/int4 量化、推测式解码、张量并行,并兼容 Nvidia 与 AMD GPU,具备极低延迟。适配 LLaMA、Mixtral 8x7B 等主流模型,适合开发者用于快速实验、定制和性能优化。该项目不做大型框架,仅作为高性能 PyTorch 推理实现的参考和起点,便于学习和二次开发。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🗣 每日羊毛线报 👈


🏵 Abogen - 文本转有声书工具

🍥 简介:
Abogen 是一款高效的文本转语音工具,可将 EPUB、PDF 及纯文本文件快速转换为高质量有声书,同时生成同步字幕。支持多种语音风格、语速调整、字幕格式选择及音频格式输出,适合音频读物、视频配音及内容创作场景。内置队列批量处理、章节拆分、元数据编辑和自定义语音混合等功能,兼容主流平台与 GPU 加速。界面友好、配置灵活,适合个人和内容创作者高效生成专业有声内容。

🍭 #有声书生成 #文本转语音


🎈 【进入项目】


🎯 关注频道 🤖 合作/投稿
🗣 每日羊毛线报 👈


🏵 KVoiceWalk - Kokoro语音克隆

🍥 简介:
KVoiceWalk 是一款为 Kokoro 文本转语音引擎设计的语音风格克隆应用。它利用随机漫步算法和混合评分方法(结合 Resemblyzer 相似度、特征提取和自相似性)来生成新的 Kokoro 语音风格张量,从而克隆目标声音。该项目旨在探索更高级的遗传算法,验证评分函数和总体概念,为 Kokoro 增加更多语音选项。

🍭 #语音克隆 #文本转语音


🎈 【进入项目】


🎯 关注频道 🤖 合作/投稿
🗣 每日羊毛线报 👈


🏵 Spark-TTS - 高效LLM文本转语音

🍥 简介:
Spark-TTS 是一款基于大型语言模型(LLM)的高效文本转语音(TTS)推理系统。它利用 Qwen2.5 模型,直接从预测的语音代码重建音频,无需额外的声学特征生成模型,简化了流程并提升效率。该项目支持高质量的零样本(Zero-shot)语音克隆,能复制未曾训练过的说话人声音,尤其适用于跨语言和语码转换场景。Spark-TTS 支持中英双语,并允许通过调整参数控制生成语音的特性。

🍭 #文本转语音 #语音合成


🎈 【进入项目】


🎯 关注频道 🤖 合作/投稿
 
 
Back to Top