L

Layoutlmv2 Large Uncased Finetuned Vi Infovqa

由 tiennvcs 开发
基于microsoft/layoutlmv2-large-uncased微调的文档视觉问答模型,适用于越南语信息提取任务
下载量 16
发布时间 : 3/2/2022

模型简介

该模型是针对文档视觉问答(VQA)任务优化的LayoutLMv2模型,特别适配越南语信息提取场景,能够理解文档布局和视觉信息进行问答

模型特点

多模态理解能力
结合文本、布局和视觉信息进行综合理解
越南语优化
专门针对越南语文档信息提取任务进行微调
文档结构感知
能够理解文档的版面布局和结构信息

模型能力

文档视觉问答
越南语信息提取
文档布局分析
多模态理解

使用案例

文档处理
越南语表单信息提取
从越南语表单文档中自动提取关键信息
文档视觉问答系统
回答关于文档内容的自然语言问题
AIbase
智启未来,您的人工智能解决方案智库
简体中文