L

Layoutlmv3 Base Mpdocvqa

由 rubentito 开发
该模型是基于微软LayoutLMv3预训练模型,在多页文档问答(MP-DocVQA)数据集上微调的文档视觉问答模型。
下载量 664
发布时间 : 2/21/2023

模型简介

该模型专门用于文档视觉问答任务,能够处理多页文档中的问答需求,结合文本和视觉信息进行答案预测。

模型特点

多模态处理能力
结合文本和视觉信息进行文档理解,适用于复杂的文档视觉问答任务。
多页文档支持
能够处理多页文档中的问答需求,预测答案所在页面。
高效性能
在125M参数规模下实现较好的文档问答性能。

模型能力

文档视觉问答
多页文档处理
文本和视觉信息融合

使用案例

文档处理
合同文档问答
从多页合同文档中提取特定条款信息
ANLS 0.4538, APPA 51.9426
报告文档分析
分析多页报告文档中的关键数据
AIbase
智启未来,您的人工智能解决方案智库
简体中文