L

Lilt Document QA

由 TusharGoel 开发
LiLT是一个基于文档视觉问答(DocVQA)任务的预训练模型,专门用于处理英文文档中的问答任务。
下载量 80
发布时间 : 10/15/2023
模型介绍
内容详情
替代品

模型简介

LiLT模型通过结合文本和布局信息,能够理解文档结构并回答相关问题,特别适用于表单、发票等结构化文档的问答场景。

模型特点

多模态理解
同时处理文本内容和文档布局信息,增强对结构化文档的理解能力
文档结构感知
通过边界框信息捕捉文档元素的空间关系
英文文档优化
专门针对英文文档问答任务进行微调

模型能力

文档问答
结构化信息提取
表单理解

使用案例

文档处理
表单信息提取
从结构化表单中提取特定字段信息
可准确识别表单中的关键信息如许可证编号、日期等
发票处理
回答关于发票内容的特定问题
可定位发票中的金额、供应商等信息