D

Dit Base Finetuned Rvlcdip Finetuned Data200

由 AthiraVr 开发
该模型是基于microsoft/dit-base-finetuned-rvlcdip在图像文件夹数据集上微调的版本,主要用于图像分类任务。
下载量 16
发布时间 : 2/27/2023
模型介绍
内容详情
替代品

模型简介

这是一个经过微调的图像分类模型,基于DiT(Document Image Transformer)架构,在文档图像分类任务上进行了优化。

模型特点

文档图像优化
专门针对文档图像分类任务进行了优化
迁移学习
基于预训练的DiT模型进行微调
200轮训练
经过200轮训练,达到相对稳定的性能

模型能力

文档图像分类
图像特征提取

使用案例

文档处理
文档类型识别
自动识别不同类型的文档(如发票、合同、表格等)
在评估集上达到56.99%的准确率