许可证: 其他
标签:
- 视觉
- 图像分割
- 训练生成
模型索引:
- 名称: segformer-b0-finetuned-segments-stamp-verification
结果: []
指标:
- 代码评估
- 准确率
segformer-b0邮票验证微调版
本模型是基于nvidia/mit-b0在bilal01/stamp-verification数据集上微调的版本。在评估集上取得如下结果:
- 损失值: 0.0372
- 平均交并比: 0.1908
- 平均准确率: 0.3817
- 总体准确率: 0.3817
- 未标记准确率: 无
- 邮票准确率: 0.3817
- 未标记交并比: 0.0
- 邮票交并比: 0.3817
模型描述
StampSegNet是一个专为邮票分割设计的语义分割模型,基于强大的Hugging Face框架构建。该模型通过深度学习技术,能够精确高效地从图像中分割邮票。
经过训练,该模型可识别并分类图像中属于邮票的区域。通过理解邮票特有的复杂图案、边框和鲜明色彩等特征,StampSegNet能生成像素级分割图,精准标出图像中邮票的边界。
应用场景与限制
邮票收藏管理:邮票收藏爱好者可使用本模型自动从图像中分割邮票,简化邮票收藏的整理编目流程,节省时间精力。
电商平台:面向邮票买卖的在线市场和拍卖平台可集成本模型提升用户体验。卖家上传邮票图像后,模型能自动提取并展示分割后的邮票,方便买家搜索、分类和估价。
尽管StampSegNet在邮票分割上表现优异,但在处理严重损坏/遮挡的邮票、特殊形状邮票或光照条件差的图像时可能面临挑战。此外,与所有AI模型类似,训练数据中的潜在偏差可能影响分割结果,需谨慎评估并规避伦理风险。
训练与评估数据
数据集来自Kaggle平台:
{dataset}(https://www.kaggle.com/datasets/rtatman/stamp-verification-staver-dataset)
我们选取60个样本并在Segments.ai平台进行标注
训练流程
数据收集与准备:
- 收集包含邮票图像及对应像素级标注的多样化数据集
- 确保涵盖不同设计、尺寸、颜色、背景和光照条件的邮票
- 将数据集划分为训练集和验证集
模型选择与配置:
- 选用适合邮票分割任务的语义分割模型架构
- 以nvidia/mit-b0作为预训练模型进行微调
- 配置模型架构及学习率、批量大小、优化器等超参数
训练过程:
- 使用标注数据训练模型
- 采用交叉熵损失或Dice损失等分割任务专用损失函数
- 使用Adam优化器更新模型参数
- 通过像素准确率、平均交并比等指标监控训练进度
训练超参数
训练期间使用以下超参数:
- 学习率: 6e-05
- 训练批量大小: 2
- 评估批量大小: 2
- 随机种子: 42
- 优化器: Adam (beta1=0.9, beta2=0.999, epsilon=1e-08)
- 学习率调度器类型: 线性
- 训练轮次: 20
训练结果
训练损失 |
轮次 |
步数 |
验证损失 |
平均交并比 |
平均准确率 |
总体准确率 |
未标记准确率 |
邮票准确率 |
未标记交并比 |
邮票交并比 |
0.3384 |
0.83 |
20 |
0.2769 |
0.0335 |
0.0670 |
0.0670 |
无 |
0.0670 |
0.0 |
0.0670 |
0.2626 |
1.67 |
40 |
0.2201 |
0.1256 |
0.2512 |
0.2512 |
无 |
0.2512 |
0.0 |
0.2512 |
0.1944 |
2.5 |
60 |
0.1918 |
0.2030 |
0.4060 |
0.4060 |
无 |
0.4060 |
0.0 |
0.4060 |
... |
... |
... |
... |
... |
... |
... |
... |
... |
... |
... |
0.0355 |
19.17 |
460 |
0.0382 |
0.2032 |
0.4064 |
0.4064 |
无 |
0.4064 |
0.0 |
0.4064 |
0.0447 |
20.0 |
480 |
0.0372 |
0.1908 |
0.3817 |
0.3817 |
无 |
0.3817 |
0.0 |
0.3817 |
框架版本
- Transformers 4.28.0
- Pytorch 2.0.0+cu118
- Datasets 2.12.0
- Tokenizers 0.13.3