许可协议:apache-2.0
评估指标:
- 准确率
任务类型:图像分类
标签:
- 艺术
库名称:transformers
AI与人类图像分类模型
该模型基于6万张AI生成图像和6万张人类图像进行微调训练,在检测Midjourney v6.1、Flux 1.1 Pro、Stable Diffusion 3.5、GPT-4o等前沿AI模型生成的高质量图像方面表现卓越。
详细训练代码见:blog/ai/fine-tuning-siglip2
评估指标

🏋️♂️ 训练指标
- 训练轮次: 5.0
- 总浮点运算量: 51,652,280,821 GF
- 训练损失: 0.0799
- 训练耗时: 2小时39分49.46秒
- 训练样本/秒: 69.053
- 训练步数/秒: 4.316
📊 测试集评估指标(微调后模型)
- 评估轮次: 5.0
- 评估准确率: 0.9923
- 评估损失: 0.0551
- 评估耗时: 2分35.78秒
- 评估样本/秒: 212.533
- 评估步数/秒: 6.644
🔦 测试集预测指标:
{
"测试损失": 0.05508904904127121,
"测试准确率": 0.9923283699296264,
"测试耗时": 167.1844,
"测试样本/秒": 198.039,
"测试步数/秒": 6.191
}
- 最终测试准确率:0.9923
- 最终测试F1分数(宏观):0.9923
- 最终测试F1分数(加权):0.9923
使用方式
pip install -q transformers torch Pillow accelerate
import torch
from PIL import Image as PILImage
from transformers import AutoImageProcessor, SiglipForImageClassification
模型标识 = r"Ateeqq/ai-vs-human-image-detector"
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
print(f"使用设备: {device}")
try:
print(f"加载处理器: {模型标识}")
processor = AutoImageProcessor.from_pretrained(模型标识)
print(f"加载模型: {模型标识}")
model = SiglipForImageClassification.from_pretrained(模型标识)
model.to(device)
model.eval()
print("模型加载成功")
except Exception as e:
print(f"加载失败: {e}")
exit()
图片路径 = r"/content/images.jpg"
try:
print(f"读取图片: {图片路径}")
image = PILImage.open(图片路径).convert("RGB")
except FileNotFoundError:
print(f"错误: 图片文件不存在 {图片路径}")
exit()
except Exception as e:
print(f"读取错误: {e}")
exit()
print("图像预处理中...")
inputs = processor(images=image, return_tensors="pt").to(device)
print("运行推理...")
with torch.no_grad():
outputs = model(**inputs)
logits = outputs.logits
预测类别索引 = logits.argmax(-1).item()
预测标签 = model.config.id2label[预测类别索引]
probabilities = torch.softmax(logits, dim=-1)
预测置信度 = probabilities[0, 预测类别索引].item()
print("-" * 30)
print(f"图片路径: {图片路径}")
print(f"预测结果: {预测标签}")
print(f"置信度: {预测置信度:.4f}")
print("-" * 30)
print("各类别得分:")
for i, label in model.config.id2label.items():
print(f" - {label}: {probabilities[0, i].item():.4f}")
输出示例
使用设备: cpu
模型加载成功
读取图片: /content/images.jpg
图像预处理中...
运行推理...
------------------------------
图片路径: /content/images.jpg
预测结果: ai
置信度: 0.9996
------------------------------
各类别得分:
- ai: 0.9996
- hum: 0.0004