✨ 主要特性
- 多种指标评估:使用TopIQ - FR、ArcFace Cosine Distance、VGGFace2 Cosine Distance等指标进行评估。
- 特定数据集:基于logasja/FDF数据集进行训练。
- 图像到图像转换:适用于图像到图像的转换任务。
- 多种特性:具有对抗、美学、质量和过滤等特性。
📚 详细文档
模型描述
该模型使用了改进的vnet进行2D输入输出,具体实现可参考此处,其配置如下:
{
"activation": "ReLU",
"batch_norm": false,
"filter_num": [
128,
256,
512,
1024,
1024
],
"n_labels": 3,
"output_activation": "tanh",
"pool": false,
"res_num_ini": 1,
"res_num_max": 3,
"unpool": false
}
训练配置如下:
{
"alpha": 0.0001,
"batch": 32,
"epochs": 500,
"epsilon": 1,
"input": "(256, 256)",
"losses": {
"FEAT_ArcFace": {
"d": "cosine_similarity",
"f": "ArcFace",
"name": "FEAT_ArcFace",
"reduction": "sum_over_batch_size",
"threshold": 0.68,
"weight": 0.05
},
"FEAT_VGG-Face": {
"d": "cosine_similarity",
"f": "VGG-Face",
"name": "FEAT_VGG-Face",
"reduction": "sum_over_batch_size",
"threshold": 0.68,
"weight": 0.05
},
"IQASSIMC": {
"lower_better": false,
"name": "IQASSIMC",
"reduction": "sum_over_batch_size",
"weight": 0.5
},
"TopIQ": {
"full_ref": true,
"lower_better": false,
"name": "TopIQ",
"reduction": "sum_over_batch_size",
"score_range": "~0, ~1",
"weight": 0.5
}
},
"mixed_precision": true,
"optimizer": {
"amsgrad": false,
"beta_1": 0.9,
"beta_2": 0.999,
"clipnorm": null,
"clipvalue": null,
"ema_momentum": 0.99,
"ema_overwrite_frequency": null,
"epsilon": 1e-07,
"global_clipnorm": null,
"gradient_accumulation_steps": null,
"learning_rate": 9.999999747378752e-05,
"loss_scale_factor": null,
"name": "adamw",
"use_ema": false,
"weight_decay": 0.004
},
"seed": "BIIIIIGSTRETCH",
"testing": 0.01,
"training": 0.99
}
模型架构图

🔧 技术细节
模型信息
属性 |
详情 |
模型类型 |
基于改进vnet的图像到图像转换模型 |
基础模型 |
vnet、logasja/ArcFace、logasja/VGGFace |
训练数据 |
logasja/FDF |
评估指标 |
TopIQ - FR、ArcFace Cosine Distance、VGGFace2 Cosine Distance |
组件说明
- 激活函数:使用ReLU激活函数。
- 批归一化:未使用批归一化(batch_norm: false)。
- 过滤器数量:包含多个不同数量的过滤器。
- 输出激活函数:使用tanh作为输出激活函数。
训练配置
- 损失函数:使用多种损失函数组合,包括FEAT_ArcFace、FEAT_VGG - Face、IQASSIMC和TopIQ。
- 优化器:使用adamw优化器,并设置了相关参数。
- 训练轮数:训练500个epoch。
- 数据集划分:99%用于训练,1%用于测试。
📄 许可证
本模型使用GPL - 3.0许可证。