pdf-extract-api：高精度文档解析和提取API开源项目-盘天下

pdf-extract-api：高精度文档解析和提取API开源项目

编程开发 2024-11-22 1169 0

pdf-extract-api：高精度文档解析和提取 API 开源项目

一个文档解析和提取 API，支持将 PDF 或图片文件转换为结构化的 JSON 或 Markdown 格式。

它利用了先进的 OCR 技术和 Ollama 支持的语言模型来实现高精度文本转换和去除敏感信息。

支持离线运行、分布式任务处理、Redis 缓存、CLI 操作工具以及对图片中的表格、数学公式的处理。

开源地址：https:// github .com/CatchTheTornado/pdf- extra ct-api

转载请注明出处，本文链接：https://pantx.cn/13827.html

#pdfextractapi #设计资源 #开源项目

(0)

1. 本站所有资源来源于网络，如有侵权请邮件联系站长！hygd0813@qq.com
2. 分享目的仅供大家学习和交流，您必须在下载后24小时内删除！
3. 不得使用于非法商业用途，不得违反国家法律。否则后果自负！
4. 本站提供的资源，都不包含版权，请大家谅解！
5. 如有链接无法下载、失效或广告，请联系管理员处理！
6. 本站资源售价只是赞助，收取费用仅维持本站的日常运营所需！

上一篇IC-Light：一款开源AI智能打光工具

下一篇Python分布式爬虫与逆向进阶实战