D

Document Qa Model

由 lakshya-rawat 开发
基于LayoutLMv3-base微调的文档问答模型,能够利用OCR数据理解文档并回答相关问题。
下载量 54
发布时间 : 4/19/2025
模型介绍
内容详情
替代品

模型简介

该模型经过训练,能够利用OCR数据(通过PaddleOCR)理解文档,并准确回答与文档布局中结构化信息相关的问题。

模型特点

多语言支持
支持英语、西班牙语、法语、德语和意大利语的文档问答。
布局感知
能够理解文档的布局和结构,提高问答准确性。
OCR集成
结合PaddleOCR提取的文本和位置信息,增强文档理解能力。

模型能力

文档图像问答
文本信息提取
结构化查询回答

使用案例

文档处理
水电账单解析
从水电账单图像中提取并回答关于费用、日期等信息。
高准确率的费用和日期信息提取。
发票信息提取
从发票图像中提取供应商、金额和商品信息。
结构化输出供应商和金额信息。