P

PP DocBlockLayout

由 PaddlePaddle 开发
PP-DocBlockLayout 是一个基于 RT-DETR-L 训练的文档布局块定位模型,能够有效识别多种文档类型中的布局区域。
下载量 1,039
发布时间 : 6/6/2025

模型简介

该模型专注于文档布局分析,能够识别中英文论文、PPT、杂志、合同、书籍等多种文档中的布局区域,适用于文档结构化和信息提取任务。

模型特点

多文档类型支持
训练数据涵盖中英文论文、PPT、杂志、合同、书籍等多种文档类型,具有广泛的适用性。
高精度检测
在自建数据集上达到 95.9% 的 mAP(0.5) 精度,能够准确识别文档中的布局区域。
易于集成
提供简单的安装和使用方式,支持快速集成到现有项目中。

模型能力

文档布局检测
多文档类型识别
布局区域定位

使用案例

文档处理
论文结构分析
识别论文中的标题、正文、图表等区域,辅助论文结构分析。
准确划分论文各部分区域
合同信息提取
定位合同中的关键条款区域,便于后续信息提取。
准确识别合同条款区域
教育
试卷分析
识别试卷中的题目、选项等区域,辅助自动阅卷系统。
准确划分试卷各题目区域
AIbase
智启未来,您的人工智能解决方案智库
简体中文