L

Layoutlmv3 Finetuned DocLayNet

由 Mit1208 开发
基于LayoutLMv3架构微调的文档布局分析模型,专门用于处理DocLayNet数据集中的文档元素分类任务。
下载量 226
发布时间 : 3/24/2023
模型介绍
内容详情
替代品

模型简介

该模型是在microsoft/layoutlmv3-base基础上微调的版本,主要用于文档图像中的令牌分类任务,能够识别和分类文档中的不同布局元素。

模型特点

文档布局理解
能够理解文档的视觉布局和文本内容,识别文档中的不同元素区域
多模态处理
同时处理文本内容和视觉布局信息,实现更准确的文档分析
高效微调
基于预训练的LayoutLMv3模型进行微调,在特定任务上表现良好

模型能力

文档布局分析
视觉文本分类
文档元素识别

使用案例

文档处理
合同分析
自动识别合同文档中的标题、段落、签名区域等元素
F1值达到0.6667
学术论文解析
提取论文中的摘要、正文、图表、参考文献等部分
数字化办公
表格识别
从扫描文档中识别表格区域和内容