MinerU 深度解析：62.7k Star 的文档解析引擎，从 PDF 到 Markdown 只用一行命令

📝

深度剖析 MinerU v3.1.11：OpenDataLab 开源的文档解析引擎，62.7k Star，支持 PDF/DOCX/PPTX/XLSX → Markdown/JSON，VLM+OCR 双引擎，MCP Server 集成，109 种语言，全面适配国产算力。

原文：https://github.com/opendatalab/MinerU

一句话说清楚 MinerU 是什么

MinerU 是 OpenDataLab 开源的文档解析引擎，核心能力：将 PDF、DOCX、PPTX、XLSX、图片、网页一键转为结构化的 Markdown 或 JSON。

如果用过 Pandoc、PyMuPDF、Marker 等工具被表格错位/公式丢失/多栏混乱折磨过，MinerU 值得一试。

截至 2026 年 5 月，62,724 Stars | 5,286 Forks。诞生于上海 AI 实验室 InternLM 的预训练过程，初期专门解决科技文献中的符号转换问题，如今已演进为企业级文档解析基座。

能力	说明
输入格式	PDF、DOCX、PPTX、XLSX、图片、网页
输出格式	Markdown、JSON（按阅读顺序排列）、丰富中间格式
公式处理	自动识别 → LaTeX
表格处理	自动识别 → HTML，支持跨页表格合并
语言支持	OCR 识别 109 种语言
版面处理	多栏布局、手写体、扫描件、页眉页脚自动去除
段落合并	截断段落智能合并，输出符合人类阅读顺序
可视化	Layout 可视化、Span 可视化，方便质检

DOCX 原生解析：不再先转 PDF 再解析，端到端速度提升数十倍，无幻觉
Pipeline 精度跃升：OmniDocBench v1.5 得分 86.2，超过上一代 VLM
API/CLI/Router 编排升级：新增异步任务接口、mineru-router 多 GPU 负载均衡
线程安全：全面支持多线程并发推理
移除 AGPLv3 依赖：彻底移除 doclayoutyolo、mfd_yolov8（AGPLv3）和 layoutreader（CC-BY-NC-SA 4.0）

最新版本 v3.1.11（2026-05-09），持续优化管道模式的表格解析性能。

内存最低 16GB，推荐 32GB+。磁盘 20GB+（SSD 推荐）。Python 3.10~3.13。

MinerU 不只是命令行工具，已有完整集成生态：

1 2	pip install -U 'mineru[core]' mineru -p /path/to/file.pdf -o /path/to/output

输出目录结构清晰：images/（提取的图片）、output.md（结构化 Markdown）、output.json（按阅读顺序的 JSON）。

工具	Stars	核心优势	劣势
MinerU	62.7k	VLM+OCR 双引擎，多格式原生解析	部署较重，GPU 需求
MarkItDown	41k	轻量，微软出品	仅转 Markdown，复杂表格弱
PyMuPDF	—	轻量，纯 Python	无 OCR，无公式识别
Pandoc	35k+	格式转换之王	无 OCR，版面保真度低
Marker	16k	快速 PDF→Markdown	DOCX/PPTX 支持弱

一行总结：MinerU 是目前 GitHub 上最活跃、综合能力最强的开源文档解析引擎——如果文档解析是你的瓶颈，先跑一遍 MinerU 试试。