P

PP DocLayout L

由 PaddlePaddle 开发
PP-DocLayout-L 是一个高精度的文档布局区域定位模型,基于 RT-DETR-L 架构,支持检测 23 种常见文档布局类别。
下载量 285
发布时间 : 6/6/2025

模型简介

该模型专门用于文档布局检测,能够精确定位文档中的各种元素,如文本、表格、图像等,为文档处理提供结构化信息。

模型特点

高精度布局检测
在自建数据集上训练,mAP(0.5)达到90.4%,能够准确识别文档中的各种布局元素。
多类别支持
支持检测23种常见文档布局类别,包括文本、表格、图像、页眉页脚等。
广泛文档类型适用
适用于论文、杂志、合同、书籍、试卷和研究报告等多种文档类型。

模型能力

文档布局检测
表格识别
文本区域定位
图像区域检测

使用案例

文档处理
学术论文分析
自动识别论文中的标题、正文、参考文献等结构元素
实现论文内容的自动分类和结构化
合同解析
检测合同文档中的关键条款和签名区域
提高合同审查效率
办公自动化
文档数字化
将扫描文档转换为结构化数字格式
便于后续内容检索和处理
AIbase
智启未来,您的人工智能解决方案智库
简体中文