打工人必备,一键完成 PDF 文档内容提取,帮你实现工作效率翻倍!

MinerU 是一款将 PDF 转化为机器可读格式的工具(如 markdown、json),可轻松提取为任何格式。支持 176 种语言的准确识别,进行精准的语言类型鉴定。 它专门设计用于将包含图片、公式、表格、脚注等复杂多模态 PDF 文档转化为清晰、易于分析的 Markdown 格式。此外,MinerU 也支持从包含广告等干扰信息的网页、电子书中快速解析和抽取正式内容,从而有效提高 AI 语料的准备效率。

 使用云平台:OpenBayes

http://openbayes.com/console/signup?r=sony_0m6v

 登录到 OpenBayes 平台后,打开「公共教程」,找到「Flash-VStream 视频理解 Demo」的教程。

进入到教程界面后,点击右上角「克隆」。

平台在克隆过程中以自动为我们配置好了模型文件,点击「下一步:选择算力」。

平台会自动选择合适的算力资源和镜像版本,这里使用的是英伟达 RTX 4090的算力和 PyTorch 的镜像,点击「审核并执行」。可以使用文章开头的邀请链接,获得 RTX 4090 使用时长!

确认模型信息无误后,点击「继续执行」。

稍等片刻,待系统分配好资源,状态栏显示为「运行中」后,将鼠标悬停在 API 地址处,点击链接进入模型。使用 API 需要进行现进行实名认证~

进入 Demo 页面后,我们就可以上传 PDF 文件来进行提取了,需要注意的是上传的 PDF 文件大小不要超过 5 兆。我们选择示例里的一篇论文进行演示。

点击「Submit」生成。

可以看到很快就将 PDF 内容提取出来了。

资源下载: