F

Florence 2 FT DocVQA

由 sahilnishad 开发
基于Florence-2-base微调的文档视觉问答模型,专门用于处理文档图像中的问答任务。
下载量 4,928
发布时间 : 11/2/2024
模型介绍
内容详情
替代品

模型简介

该模型在DocumentVQA数据集上进行了微调,能够理解文档图像内容并回答相关问题,适用于各种文档分析场景。

模型特点

文档图像理解
能够解析和理解文档图像中的内容和结构
问答能力
针对文档内容提供准确的问答功能
多模态处理
同时处理视觉和文本信息,实现跨模态理解

模型能力

文档图像分析
视觉问答
文本提取
跨模态理解

使用案例

文档处理
合同分析
从合同文档中提取关键条款和条件
发票处理
识别发票中的金额、日期和供应商信息
教育
试卷批改
自动批改学生答卷并提取答案