挖掘有趣 Github 的猫。


有事联系:https://t.me/qumaobot
🍭 #OCR #人工智能 #文档识别


🏵 GLM-OCR - 高精度复杂文档OCR识别模型


🍥 简介:
GLM-OCR是一款拥有9亿参数的文档识别模型。该模型针对表格、代码、数学公式、印章及票据等复杂文档场景进行了深度优化,在OmniDocBench V1.5基准测试中取得了94.62的高分,能够精准提取复杂排版中的关键文本信息。


🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #OCR #人工智能 #文档处理


🏵 Chandra OCR 2 - 多格式高精度文档识别模型

🍥 简介:
Chandra OCR 2 是一款先进的识别模型,支持将图像及 PDF 文档转换为结构化的 Markdown、HTML 或 JSON 格式。该模型在保持复杂排版、表格、数学公式及手写文本完整性的同时,提供超过 90 种语言的高精度识别。其在 olmOCR 等多项行业基准测试中表现优异,综合识别准确率处于领先水平。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #文档解析 #AI识别


🏵 Dots.ocr - 文档智能解析

🍥 简介:
Dots.ocr是一款多语言文档解析器。它将版面识别与内容解析整合至统一的“视觉-语言”模型,并能保持自然的阅读顺序。该程序基于紧凑型17亿参数语言模型,却能提供最先进(SOTA)的性能表现。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🍭 #合规检测 #文档分析 #法律科技 #AI应用


🏵 合规编译器 - 文档法规不合规检测


🍥 简介:
Compliance Compiler是一款开放核心工具,专注于识别文档及司法判决中的形式和法规不合规项。该工具不提供任何法律评估或建议,以确定性、可复现和安全的方式运行。其核心功能包括规范与权限层级分析,并提供可选的AI解析能力,支持用户更换大型语言模型(LLM)提供商。项目提供命令行、Web界面及API多种交互模式,采用AGPL-3.0开源协议。


🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
 
 
Back to Top