一个文档解析和提取 API,支持将 PDF 或图片文件转换为结构化的 JSON 或 Markdown 格式。
它利用了先进的 OCR 技术和 Ollama 支持的 语言 模型来实现高精度文本转换和去除敏感信息。
支持离线运行、分布式任务处理、Redis 缓存、CLI 操作工具以及对图片中的表格、 数学 公式的处理。
一个文档解析和提取 API,支持将 PDF 或图片文件转换为结构化的 JSON 或 Markdown 格式。
它利用了先进的 OCR 技术和 Ollama 支持的 语言 模型来实现高精度文本转换和去除敏感信息。
支持离线运行、分布式任务处理、Redis 缓存、CLI 操作工具以及对图片中的表格、 数学 公式的处理。
开源地址:https:// github .com/CatchTheTornado/pdf- extra ct-api
1. 本站所有资源来源于网络,如有侵权请邮件联系站长!hygd0813@qq.com 2. 分享目的仅供大家学习和交流,您必须在下载后24小时内删除! 3. 不得使用于非法商业用途,不得违反国家法律。否则后果自负! 4. 本站提供的资源,都不包含版权,请大家谅解! 5. 如有链接无法下载、失效或广告,请联系管理员处理! 6. 本站资源售价只是赞助,收取费用仅维持本站的日常运营所需!
本站为非经营类网站,资源全部来源于网络,不制作和存储任何资源,资源版权归原著作权人所有,请于下载后24小时内删除,如涉版权或其他问题请E-Mail联系,我们将及时撤销相应资源!
Copyright © 2024 盘天下 | 精选资源分享 冀ICP备2020025925号-1
页面耗时0.0749秒, 内存占用2.02 MB, 访问数据库57次
评论列表
发表评论