L

Layoutlmv2 Base Uncased Finetuned Docvqa V2

由 MariaK 开发
该模型是基于microsoft/layoutlmv2-base-uncased在文档视觉问答任务上微调的版本,专注于处理文档图像中的文本和布局信息。
下载量 54
发布时间 : 2/9/2023
模型介绍
内容详情
替代品

模型简介

LayoutLMv2模型通过结合文本、布局和视觉信息,专门用于文档理解任务。该微调版本针对文档视觉问答(DocVQA)任务进行了优化。

模型特点

多模态理解
同时处理文档中的文本内容、空间布局和视觉特征
文档问答能力
针对文档图像中的问题提供准确的文本回答
布局感知
理解文档中文本的空间排列关系,增强语义理解

模型能力

文档图像理解
视觉问答
文本布局分析
多模态信息处理

使用案例

文档处理
表单信息提取
从扫描的表单文档中提取特定字段信息
合同分析
回答关于合同文档内容的特定问题
教育
试卷自动批改
分析学生答卷并回答评分相关问题