V

Vit Base Blur

由 WT-MM 开发
该模型是基于google/vit-base-patch16-224-in21k在模糊图像数据集上微调的版本,用于区分模糊图像和清晰图像。
下载量 92
发布时间 : 7/5/2023
模型介绍
内容详情
替代品

模型简介

该模型用于二分类任务,区分'噪声'(模糊)图像和清晰图像,其中'噪声'图像是LDM(潜在扩散模型)在图像生成过程中未完成或迭代次数不足的结果。

模型特点

高准确率
在评估集上取得了1.0的准确率,能够有效区分模糊和清晰图像。
基于ViT架构
采用Vision Transformer (ViT)架构,具有强大的图像处理能力。
小样本微调
仅使用约1000张图像进行微调,即可达到优异性能。

模型能力

图像分类
模糊图像检测
二分类任务

使用案例

图像质量检测
生成图像质量评估
用于评估LDM生成的图像是否达到足够的清晰度
准确区分30步和10步生成的图像
图像预处理
自动过滤模糊图像
在图像处理流程中自动识别并过滤低质量图像