旗讯智能文档处理 DocParser

把各类文档转成可用数据

支持 PDF、图片、扫描件、表格和网页内容解析，输出 Markdown、JSON、字段结果与证据位置，适用于合同、票据、表单、报告等文档处理场景，帮助企业减少人工录入并加快系统对接。

查看智能文档查看技能开发

01 多格式输入

先把 PDF、图片、表格和网页统一收进来

统一接收不同来源、不同格式的材料，先把分散文件收口到同一条解析链路。只有输入稳定，后面的 OCR、版面理解和结构化输出才更可靠。

1 支持 PDF、扫描件、图片、Word、PPT、Excel 和 URL

2 一套入口同时接收单份文件、批量材料和网页内容

3 为后续工作区、业务系统和 Skill 提供统一上游数据源

Access 统一入口 Upload / Batch / URL

多格式输入

PDF

合同 PDF

文字层 / 扫描件 / 多页文件

IMG

图片与票据

发票、回单、证照、表单截图

WEB

表格与网页

Excel、PPT、Word、URL

ACCESS 统一接入层

来源记录、权限校验、任务排队和格式预处理在接入阶段统一完成。

解析链路

格式归一

文件、URL 和批量材料进入同一任务队列

解析编排

OCR、版面理解、表格拆分按材料类型调度

结构输出

生成 Markdown、JSON、字段和证据位置

版面理解结果 report_2026_0421.pdf

版面区块

标题、正文、图片、表格、页眉页脚

复杂元素

跨页表格、嵌入图片、混排段落

区块	结果	位置
标题层级	H1 / H2 / H3	第 1-4 页
表格区域	付款计划表 2 个	第 3 页 / 第 5 页
图片说明	保留上下文关联	图 2 / 图 4

02 版面理解

不只识别文字，还要保留文档原本的结构关系

除了识别文字，还会把标题层级、段落关系、图片上下文、表格结构和页码位置一起整理出来，让后续工作区、业务系统和规则处理拿到更干净、更有上下文的数据。

OCR版面理解表格拆分图片上下文

03 结构化输出

输出给系统，也方便人工复核

输出不只是可阅读文本，还包括 Markdown、JSON、表格结构、字段值和原文证据位置，方便直接进入工作区、业务系统和规则处理。

1 输出 Markdown / JSON / HTML 等可消费格式

2 保留页码、区块、字段和原文证据位置

3 方便直接进入工作区、业务系统和 Skill 处理链路

查看智能文档查看技能开发

结构化结果预览 Markdown / JSON

Markdown JSON CSV

# 合同摘要
## 付款条件
30% 预付款，70% 验收后支付。

字段结果：合同编号、金额、甲乙方、日期、付款计划、盖章页。

证据位置：付款条件 -> 第 3 页第 2 段；盖章页 -> 第 10 页。

可继续进入

工作区 结果入库

流程 自动处理

Skill 规则处理

产品体验 智能文档

结果去向 工作区 / 系统 / 规则处理

结果入库

解析后的 Markdown 和字段结果进入文档工作区或业务台账。

流程自动化

把解析结果交给自动化流程继续处理和分发。

Skill 处理

继续进入 Skill 规则判断、业务校验和结果生成。

智能文档

进入 OCR + Skill 一体化产品，继续完成业务链路。

04 业务可接入

文档解析的意义，是让后面的系统直接开始工作

只有当输出结果是结构化、机器可读、带上下文和证据位置的数据时，智能文档工作区、规则处理和业务系统才能真正接上。文档解析不是单点能力，而是后续业务链路的基础输入层。

Machine ReadableWorkflow Ready业务系统Skill

FAQ

PDF 转 Markdown、JSON 与表格提取常见问题

围绕 PDF 和扫描件怎么转 Markdown、JSON 或结构化结果，能不能保留表格和版面结构，以及合同、发票、银行流水这类文档能提取哪些字段，先把最常见的问题讲清楚。

查看智能文档查看技能开发

PDF、扫描件和图片都能转成 Markdown 或 JSON 吗？

可以。文档解析常见支持 PDF、图片、扫描件、合同、发票、银行流水、表单、报告、表格，以及部分网页和办公文档。重点不是只把某一类文件转成纯文本，而是让不同来源的材料都能进入同一条解析链路，输出成更适合后续处理的结构化结果。

PDF 提取后能输出哪些结果格式？

除了可阅读文本，文档解析还可以输出 Markdown、JSON、HTML、字段结果、表格结构和原文证据位置。这样既方便人工查看，也方便后续工作区、规则处理和业务系统继续消费这些结果。

PDF 提取、扫描件识别和普通 OCR 有什么区别？

普通 OCR 更偏向把图像转成文字，而 PDF 提取和扫描件识别更强调结构理解和结果可用性。除了识别文字，还会继续处理标题层级、段落关系、表格拆分、图片上下文和字段定位，让输出能直接进入后续流程，而不是停留在原始文本层。

PDF 转 Markdown 或 JSON 后，表格和版面结构还能保留吗？

可以。文档解析的目标不是把文档拍平成一段纯文本，而是尽量保留标题层级、段落关系、表格结构、字段值和原文页码或证据位置。这样后续复核时可以知道结果从哪里来，也方便系统按结构继续消费。

合同、发票、银行流水、表格这类文档能提取字段吗？

可以。这类材料通常不只是提取整段文本，还会继续提取金额、日期、编号、主体、账户信息、关键字段和表格行列。只要你的业务不满足于“看见文字”，而是要把文档内容继续用于审核、录入、比对或归档，字段提取就很重要。

怎么判断 PDF 提取或 OCR 是否适合当前业务？

最有效的方式是拿真实材料做小范围评估，先明确要处理的文件类型、要输出的格式、要抽取的字段、是否需要表格结构或证据位置，以及结果后续要进入哪个系统。只要这几个关键点能对齐，文档解析是否适配就会很快看出来。

高频场景

高频文档处理场景

把用户最常问的几类高频文档拆开来看，直接说明每类材料能提什么、会输出什么结果，以及结果后续通常怎么使用。

合同 OCR / 合同字段提取

合同 PDF 提取

输入材料

扫描合同
电子合同 PDF
多页附件合同

可提取内容

合同编号
甲乙方
金额与日期
付款条款
盖章页定位

输出结果

Markdown 摘要JSON 字段结果证据位置

发票识别 / 票据 OCR

发票与票据识别

输入材料

增值税发票
收据
回单
报销票据照片

可提取内容

发票号码
开票日期
税额与总额
购买方信息
票面关键字段

输出结果

字段对象JSON / Excel异常复核清单

银行流水提取 / PDF 表格提取

银行流水与表格提取

输入材料

银行流水 PDF
对账单截图
跨页表格报告

可提取内容

日期
摘要
借贷方向
金额
余额与表格行列

输出结果

表格结构CSV / JSON原文定位

让一次文档处理持续产生业务价值

如果你希望减少人工流转、重复录入和跨系统搬运，让结构结果真正进入后续业务流程，可以进一步了解旗讯智能文档处理 IDP。

联系团队