盘天下 | 精选资源分享

Surya:开源多功能文档OCR工具包

编程开发 2024-11-22 688 0

Surya:开源多功能文档 OCR 工具包

一个开源 OCR 工具,能够处理超过 90 种 语言 的文本识别,支持图像和 PDF 格式文档的 文字 提取、布局分析以及行检测。

支持批量处理,并针对 GPU 优化,能够提高处理 效率 ,还提供了交互式界面让用户更方便地测试功能。

Surya 的主要功能包括识别文档中的文本行、标题、图像、页眉等元素,并通过 JSON 格式输出结果。

开源地址:https:// github .com/VikParuchuri/surya

闲趣赚

转载请注明出处,本文链接:https://pantx.cn/16451.html

(0)
收藏 (0)

评论列表