L

Layoutlmv2 Base Uncased Finetuned Docvqa

由 tiennvcs 开发
基于LayoutLMv2架构的文档视觉问答模型,针对文档理解任务进行了微调
下载量 983
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是基于LayoutLMv2架构的预训练模型,专门针对文档视觉问答(DocVQA)任务进行了微调。它能够理解文档中的文本内容和布局信息,回答与文档内容相关的问题。

模型特点

文档布局理解
能够同时处理文本内容和文档布局信息
视觉问答能力
可以回答基于文档图像内容的问题
微调优化
针对DocVQA任务进行了专门的微调

模型能力

文档内容理解
视觉问答
文档布局分析

使用案例

文档处理
表单信息提取
从扫描的表单中提取特定信息
合同分析
回答关于合同条款的具体问题
教育
试卷批改
自动批改扫描的学生试卷