D

Deformable Detr DocLayNet

由 Aryn 开发
在DocLayNet数据集上训练的可变形DETR模型,用于文档布局分析中的目标检测任务,达到57.1的box mAP指标。
下载量 18.50k
发布时间 : 3/19/2024

模型简介

可变形DEtection TRansformer(DETR)模型,专为文档布局分析设计,能够检测文档中的各类元素。

模型特点

可变形注意力机制
采用可变形注意力模块,能够更高效地处理文档中的不规则布局和不同尺寸的元素。
端到端训练
无需传统目标检测中的锚框设计和NMS后处理,实现端到端的训练和推理。
文档布局分析优化
专门针对DocLayNet数据集优化,能够准确识别文档中的表格、文本段落、图片等11类元素。

模型能力

文档元素检测
边界框预测
类别分类

使用案例

文档处理
文档布局分析
自动识别文档中的各类元素及其位置关系
57.1 box mAP
文档数字化
帮助将纸质文档转换为结构化数字格式
AIbase
智启未来,您的人工智能解决方案智库
简体中文