MinerU是什么
MinerU是一款由上海人工智能实验室OpenDataLab团队 开发 的开源高质量数据提取工具,专注于从复杂PDF文档、网页和 电子书 中 高效 提取内容。它能够将包含图片、公式和表格的多模态PDF转化为Markdown格式(如 markdown 、json),且具备高精度解析工具链,支持多种输入模型,支持自动识别乱码、转换公式为LaTe x 、保留文档结构,支持176种 语言 的准确识别,适用于学术、财务、 法律 等领域,兼容Windows/Linux/Mac平台。
MinerU是一款由上海人工智能实验室OpenDataLab团队 开发 的开源高质量数据提取工具,专注于从复杂PDF文档、网页和 电子书 中 高效 提取内容。它能够将包含图片、公式和表格的多模态PDF转化为Markdown格式(如 markdown 、json),且具备高精度解析工具链,支持多种输入模型,支持自动识别乱码、转换公式为LaTe x 、保留文档结构,支持176种 语言 的准确识别,适用于学术、财务、 法律 等领域,兼容Windows/Linux/Mac平台。
网站:https://opendatalab.com/OpenSourceTools/Extractor/PDF
GitHub:https://github.com/opendatalab/MinerU
1. 本站所有资源来源于网络,如有侵权请邮件联系站长!hygd0813@qq.com 2. 分享目的仅供大家学习和交流,您必须在下载后24小时内删除! 3. 不得使用于非法商业用途,不得违反国家法律。否则后果自负! 4. 本站提供的资源,都不包含版权,请大家谅解! 5. 如有链接无法下载、失效或广告,请联系管理员处理! 6. 本站资源售价只是赞助,收取费用仅维持本站的日常运营所需!
Wiseflow 首席情报官 – 敏捷的开源AI信息挖掘工具
YTCH – 电视版YouTube 以电视频道形式呈现YouTube频道内容
在线英文打字练习 – Typing Practice
openai-captcha-detection :使用 OpenAI 进行验证码识别的工具
Chinese Days-中国法定节假日API库 支持Apple Google 日历订阅
Text Behind Image – 开源在线图片设计工具 轻松创建图像设计背后的文字
三千多个厂商默认帐号、默认密码(建议收藏):Default Credentials Cheat Sheet
Screenshot to Code:将任何屏幕截图或设计转换为干净的代码
本站为非经营类网站,资源全部来源于网络,不制作和存储任何资源,资源版权归原著作权人所有,请于下载后24小时内删除,如涉版权或其他问题请E-Mail联系,我们将及时撤销相应资源!
Copyright © 2024 盘天下 | 精选资源分享 冀ICP备2020025925号-1
页面耗时0.0883秒, 内存占用2 MB, 访问数据库58次
评论列表
发表评论