D

Dit Doclaynet

由 jzju 开发
基于DIT架构的文档图像分割模型,专门用于识别和分割文档中的不同元素类型。
下载量 2,527
发布时间 : 3/28/2024
模型介绍
内容详情
替代品

模型简介

该模型基于BEiT架构,针对文档图像分割任务进行了优化,能够识别11种不同的文档元素类型,如图注、脚注、公式等。

模型特点

文档元素精确分割
能够准确识别和分割11种不同类型的文档元素
基于DIT架构
采用BEiT/DIT视觉变换器架构,具有强大的特征提取能力
专业数据集训练
在DocLayNet-v1.1专业文档数据集上训练,针对文档分析优化

模型能力

文档图像分割
多类别元素识别
文档结构分析

使用案例

文档数字化
PDF文档解析
自动识别PDF文档中的不同元素区域
提高文档数字化和结构化的效率
学术论文分析
提取论文中的公式、图表和章节结构
便于学术文献的自动处理和索引
办公自动化
合同文档处理
自动识别合同中的正文、标题和签名区域
加速合同审查和管理流程