Florence-2-DocVQA开源模型 - 助力文档问答高效准确的免费解决方案

首页

Florence 2 DocVQA

由 HuggingFaceM4 开发

这是微软Florence-2模型使用Docmatix数据集（5%数据量）以1e-6学习率微调1天后的版本

文本生成图像

Transformers

#图文理解 #小样本微调 #文档解析

下载量 3,096

发布时间 : 6/21/2024

模型简介

基于Florence-2-large-ft微调的多模态模型，擅长图像文本到文本转换任务

模型特点

多模态理解

能够处理图像和文本的联合输入，生成相关文本输出

高效微调

仅使用5%的Docmatix数据集进行微调，学习率为1e-6

基于Florence-2架构

建立在微软强大的Florence-2模型基础上

模型能力

图像文本理解

多模态内容生成

视觉问答

使用案例

文档处理

文档图像理解

从扫描文档图像中提取和理解文本内容

内容生成

图像描述生成

根据输入图像生成描述性文本

🚀 Transformers模型卡

本模型卡介绍的是一个图像文本到文本的模型，它基于Microsoft的Florence - 2模型进行微调，能在图像和文本交互处理方面发挥重要作用。

🚀 快速开始

使用以下代码开始使用该模型：

# 此处应补充具体代码，但原文未提供

✨ 主要特性

此为Microsoft的Florence - 2模型，使用Docmatix（占5%的数据）训练1天，学习率为1e - 6。
微调代码可在此处找到。
有一篇博客解释了如何微调Florence模型，链接为这里。

📚 详细文档

模型详情

模型描述

这是一个推送到Hugging Face Hub上的🤗 Transformers模型的模型卡，它是自动生成的。

属性	详情
开发者	Andi Marafioti
资助方	Hugging Face 🤗
语言（NLP）	英语
许可证	MIT
微调基础模型	Florence - 2 - large - ft

模型来源

仓库：[需要更多信息]
演示（可选）：[需要更多信息]

使用方式

直接使用

[需要更多信息]

下游使用（可选）

[需要更多信息]

超出适用范围的使用

[需要更多信息]

偏差、风险和局限性

[需要更多信息]

建议

用户（直接用户和下游用户）应了解该模型的风险、偏差和局限性。如需进一步建议，还需更多信息。

训练详情

训练数据

[需要更多信息]

训练过程

预处理（可选）

[需要更多信息]

训练超参数

训练机制：[需要更多信息]

速度、规模、时间（可选）

[需要更多信息]

评估

测试数据、因素和指标

测试数据

[需要更多信息]

因素

[需要更多信息]

指标

[需要更多信息]

结果

[需要更多信息]

总结

[需要更多信息]

模型检查（可选）

[需要更多信息]

环境影响

可以使用Lacoste等人（2019）提出的机器学习影响计算器来估算碳排放。

属性	详情
硬件类型	[需要更多信息]
使用时长	[需要更多信息]
云服务提供商	[需要更多信息]
计算区域	[需要更多信息]
碳排放	[需要更多信息]

技术规格（可选）

模型架构和目标

[需要更多信息]

计算基础设施

硬件

[需要更多信息]

软件

[需要更多信息]

引用（可选）

BibTeX

[需要更多信息]

APA

[需要更多信息]

术语表（可选）

[需要更多信息]

模型卡作者（可选）

[需要更多信息]

模型卡联系方式

[需要更多信息]

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文

Florence 2 DocVQA

模型简介

模型特点

模型能力

使用案例

🚀 Transformers模型卡

🚀 快速开始

✨ 主要特性

📚 详细文档

模型详情

模型描述

模型来源

使用方式

直接使用

下游使用（可选）

超出适用范围的使用

偏差、风险和局限性

建议

训练详情

训练数据

训练过程

预处理（可选）

训练超参数

速度、规模、时间（可选）

评估

测试数据、因素和指标

测试数据

因素

指标

结果

总结

模型检查（可选）

环境影响

技术规格（可选）

模型架构和目标

计算基础设施

硬件

软件

引用（可选）

BibTeX

APA

术语表（可选）

更多信息（可选）

模型卡作者（可选）

模型卡联系方式