Chunkr：开源基于视觉模型的PDF数据提取工具-盘天下

Chunkr：开源基于视觉模型的PDF数据提取工具

编程开发 2024-11-22 626 0

Chunkr：开源基于视觉模型的 PDF 数据提取工具

Chunkr 是一个开源基于视觉模型的 PDF 数据提取工具，专注于文档布局分析、OCR 和分块处理。它能够将 PDF、DOC、PPT 和 XLS 文件转换为适用于 RAG（检索增强生成）和 LLM（大语言模型）的结构化数据。Chunkr 使用先进的视觉模型和 OCR 技术，提取文档中的边界框和结构化文本，支持文本、表格、图像和手写内容的处理。由 Lu mi na AI Inc. 维护，支持 GPU 和 CPU 环境，提供免费试用和定价方案。

开源地址：https:// github .com/lumina-ai-inc/chunkr

转载请注明出处，本文链接：https://pantx.cn/12741.html

#pdf数据提取工具 #设计资源 #开源项目

(0)

1. 本站所有资源来源于网络，如有侵权请邮件联系站长！hygd0813@qq.com
2. 分享目的仅供大家学习和交流，您必须在下载后24小时内删除！
3. 不得使用于非法商业用途，不得违反国家法律。否则后果自负！
4. 本站提供的资源，都不包含版权，请大家谅解！
5. 如有链接无法下载、失效或广告，请联系管理员处理！
6. 本站资源售价只是赞助，收取费用仅维持本站的日常运营所需！

上一篇AkelPad：开源轻量级Windows文本编辑器

下一篇Org-roam：一个基于Org-mode的开源知识管理系统