挖掘有趣 Github 的猫。


有事联系:https://t.me/qumaobot
🍭 #文件转换 #开源工具 #自托管 #隐私保护 #自动化


🏵 Transmute - 多格式文件转换

🍥 简介:
Transmute是一款免费开源的自托管文件转换器,专注于隐私保护和自动化。它支持本地转换图片、视频、音频、文档、电子表格、字幕和字体,无文件大小限制,确保文件不被第三方访问。通过Docker可实现快速部署。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #文档处理 #AI工具


🏵 Paper2Any - 文档内容转多种格式

🍥 简介:
Paper2Any 是一款多功能文档处理软件,旨在将各类 PDF 格式的文章、图像或纯文本内容,通过一键操作,高效转换为多种可编辑的输出形式,如详细图表、技术路线图、实验数据图、PowerPoint 演示文稿等。其核心组件包括 Paper2Figure,专门用于生成科学研究的可视化图形;Paper2PPT,能够根据需求创建定制化的演示文稿,并精准提取表格数据;PDF2PPT,确保在转换过程中完美保留原始 PDF 的页面布局;同时,该软件还集成了人工智能技术,以进一步优化和增强设计效果。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #AI工具 #知识管理 #文档自动化


🏵 llm_wiki_agent - 将源材料转为Obsidian维基系统

🍥 简介:
llm_wiki_agent是一个基于MCP服务器的程序。它利用Claude Code技术,将各类原始素材处理并整合,自动生成一个结构化、互联的Obsidian维基系统。该系统旨在优化信息组织与知识管理,将零散数据转化为统一且易于检索的知识库。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #AI工具 #文档转换


🏵 Paper2Slides - 自动化幻灯片生成

🍥 简介:
Paper2Slides是一款为学术和专业用户设计的自动化工具。它利用先进技术,能够迅速将各类文本资料,包括科学论文、研究报告和技术文档等,智能转换为具备专业排版和视觉效果的演示幻灯片及海报。该系统旨在大幅简化传统的手动制作流程,显著提升用户内容准备的效率,同时确保最终输出材料的专业品质和视觉呈现力,满足高效沟通与展示的需求。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #Markdown工具 #文档处理


🏵 Quarkdown - Markdown文档处理工具

🍥 简介:
Quarkdown是一款强大的Markdown文档处理工具,旨在简化文档编写和格式化。它支持使用函数和变量创建复杂内容,提供超越标准Markdown的灵活性和功能。用户可将项目轻松编译为可打印书籍或交互式演示文稿,提升文档处理效率和表现力。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #图像处理 #文档处理 #PDF工具


🏵 ScanTailor Advanced - 扫描页交互式后处理工具

🍥 简介:
ScanTailor Advanced是一款交互式扫描页后处理工具。它能对原始扫描件进行页面分割、倾斜校正、边界调整及内容提取。旨在将原始扫描页转换为可直接打印或合并为PDF/DjVu的优质页面。不涉及扫描、OCR及多页文档合并。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #办公软件 #文档编辑


🏵 ZIZIYI Office - 浏览器内查看编辑Office文档

🍥 简介:
ZIZIYI Office 是一款强大的网络应用,专为在浏览器中直接查看和编辑Office文档(Word、Excel、PowerPoint)设计。该应用遵循“本地优先”原则,以确保用户文档的隐私性和安全性。它提供了与桌面软件相近的文档编辑体验,支持多种常用办公文件格式,无需安装额外软件即可进行高效的在线文档处理。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #文件共享 #跨平台应用


🏵 Raven - 跨平台文档共享

🍥 简介:
Raven是一款专为macOS和iOS平台设计的文档共享应用程序。该应用支持在用户的Mac或iPhone设备上进行文件上传与操作。所有功能均在本地运行,实现文档内容的独立管理。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #文档转换 #网页生成


🏵 Paper2All - 工作转网页产品

🍥 简介:
Paper2All 是一款将学术论文自动化转换为交互式学术网页的流水线工具。它集成从论文到演示的全过程工作流。通过迭代优化内容和布局,该工具能够高效生成具有良好排版和高度互动性的科研项目网站,提升信息传播效果。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #文档生成 #Python库


🏵 PlutoPrint - HTML/XML转PDF图像

🍥 简介:
PlutoPrint 是一款轻量级且易于使用的 Python 库,专门用于直接从 HTML 或 XML 内容生成高质量的 PDF 文件和图像。它构建于强大的 PlutoBook 渲染引擎之上,提供简洁的 API 接口,能够高效地将 HTML 结构转换为清晰的 PDF 文档或色彩丰富的图像文件。该库是自动化生成各类报告、发票以及视觉呈现材料的理想解决方案。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #文档安全工具 #PDF处理 #沙盒隔离


🏵 Dangerzone - 文档安全沙盒转换

🍥 简介:
Dangerzone用于安全处理不可信文档。它在隔离环境中将文档转为PDF,并分解为纯像素数据。脱离隔离后,这些像素数据被重建为全新的、安全的PDF。此流程旨在彻底清除文档中的恶意内容,保障文件安全。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #文档安全 #沙盒隔离 #PDF转换


🏵 Dangerzone - 文档安全隔离转换

🍥 简介:
Dangerzone接收不受信任的文档(如电子邮件附件),在沙盒环境中将其转换为PDF,再生成原始像素数据。随后,在沙盒外部,系统将这些像素数据重构为新的PDF文件。此过程可有效消除文档中潜在的恶意内容。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🍭 #文档生成 #前端工具

🏵 Htmldocs - React本地文档PDF生成

🍥 简介:
Htmldocs是一个基于React的本地文档编辑器及预览服务器。它通过HTML和CSS技术栈,高效生成PDF文件,融合LaTeX结构优势与前端开发便捷性。开发者可利用JSX创建动态文档模板,仅通过数据即可生成发票、报告等PDF。工具支持最新CSS特性,提供组件集,并全面兼容TypeScript。

🎈 【进入项目】

🗣 羊毛撸货线报 | 合作/投稿
🍭 #文档解析 #AI识别


🏵 Dots.ocr - 文档智能解析

🍥 简介:
Dots.ocr是一款多语言文档解析器。它将版面识别与内容解析整合至统一的“视觉-语言”模型,并能保持自然的阅读顺序。该程序基于紧凑型17亿参数语言模型,却能提供最先进(SOTA)的性能表现。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🍭 #AI工具 #音频生成 #文档转换 #播客工具


🏵 Doc2Podcast - PDF文档转播客音频

🍥 简介:
Doc2Podcast是一款基于人工智能的工具,旨在将PDF文档内容转换为播客格式的音频。该项目利用Next.js、React和Langflow技术栈,实现从文本文档到音频内容的自动生成与输出。其核心功能是自动化文档的音频化处理。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🍭 #AI工具 #文档处理 #开发工具


🏵 Skill Seekers - 文档代码PDF转Claude AI技能

🍥 简介:
Skill Seekers是一款工具,旨在将多源数据转化为Claude AI技能。它能处理文档网站、GitHub仓库及PDF文件,并具备自动冲突检测能力,以确保知识库的准确性和一致性。此系统简化了Claude AI的知识构建流程。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🍭 #合规检测 #文档分析 #法律科技 #AI应用


🏵 合规编译器 - 文档法规不合规检测


🍥 简介:
Compliance Compiler是一款开放核心工具,专注于识别文档及司法判决中的形式和法规不合规项。该工具不提供任何法律评估或建议,以确定性、可复现和安全的方式运行。其核心功能包括规范与权限层级分析,并提供可选的AI解析能力,支持用户更换大型语言模型(LLM)提供商。项目提供命令行、Web界面及API多种交互模式,采用AGPL-3.0开源协议。


🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🍭 #Telegram Bot #文件下载

🏵 SaveAny-Bot - 电报文件任意保存

🍥 简介:
SaveAny-Bot是一款专为Telegram设计的文件管理机器人,核心功能是实现Telegram文件的灵活保存。该程序支持文档、视频、照片、贴纸以及Telegraph等多种媒体格式的保存操作。它能够有效规避Telegram媒体文件下载限制,并提供批量下载功能,以提高效率。此外,SaveAny-Bot还支持流媒体传输,满足用户在线预览的需求。其多用户支持特性,使得该工具能够适应不同场景下的文件管理和共享需求,提供便捷的文件处理体验。

🎈 【进入项目】

🗣 羊毛撸货线报 | 合作/投稿
🍭 #文档转换 #JavaScript库


🏵 @turbodocx/html-to-docx - HTML转DOCX转换

🍥 简介:
@turbodocx/html-to-docx 是一款高性能的JavaScript库,专注于将HTML内容快速、精确地转换为DOCX格式文档。该库基于原始项目重构,由TurboDocx团队积极维护。它采用纯JavaScript实现,无外部依赖,特别适合AI文档生成和企业级报表系统等需要高吞吐量的现代应用场景,具备生产环境验证的稳定性和完善的开发者支持。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🍭 #静态分析 #文件安全


🏵 Pure - ZIP文件格式检测

🍥 简介:
Pure 是一款专为ZIP文件设计的静态分析格式检测工具,能够自动检查压缩包中的高危压缩比、协议偏差、恶意归档签名、头信息不一致、路径穿越、无效日期、重叠头部等150多类异常。它有效防御目录遍历、符号链接漏洞、解压炸弹和缓冲区溢出等攻击,极大降低被零日漏洞或恶意文件利用的风险。Pure 支持命令行及C语言接口,适合开发者集成到各类安全检测和自动化审计场景,提升文件解析和归档处理的安全性与可靠性。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
 
 
Back to Top