T

Testdocumentquestionanswering

由 Dhineshk 开发
基于LayoutLMv2架构的文档视觉问答模型,针对DocVQA任务进行微调
下载量 16
发布时间 : 9/27/2023
模型介绍
内容详情
替代品

模型简介

该模型是LayoutLMv2基础版的微调版本,专门用于处理文档视觉问答(DocVQA)任务,能够理解文档布局和文本内容的关系

模型特点

多模态理解能力
结合文本内容和视觉布局信息进行文档理解
文档结构感知
能够识别文档中的表格、段落等结构化元素
问答能力
针对文档内容回答用户提出的问题

模型能力

文档内容理解
视觉问答
文档布局分析
文本与视觉信息融合处理

使用案例

文档处理
合同分析
自动回答关于合同条款内容的问题
表格数据提取
从结构化文档中提取特定信息
教育
试卷自动批改
识别学生答卷内容并评估答案正确性