S

Segformer B5 Finetuned IDD L2 V2

由 izzako 开发
该模型是基于 NVIDIA 的 MIT-B5 架构,在 IDD 20K 语义分割数据集上微调的图像分割模型,适用于道路场景理解任务。
下载量 29
发布时间 : 3/25/2025
模型介绍
内容详情
替代品

模型简介

SegFormer-B5 是一个高效的语义分割模型,经过在 IDD 20K 数据集上的微调,能够准确识别道路场景中的多种物体和区域,包括道路、行人、车辆、建筑物等。

模型特点

高精度道路场景分割
在 IDD 20K 数据集上微调,能够准确识别道路、人行道、车辆等多种场景元素。
多类别识别能力
支持识别 20 多种不同的道路场景类别,包括静态元素(如道路、建筑物)和动态元素(如行人、车辆)。
优化的训练参数
使用 Adam 优化器和线性学习率调度器进行训练,学习率为 0.0006,训练轮次为 50。

模型能力

图像分割
道路场景理解
多类别物体识别

使用案例

自动驾驶
道路场景解析
用于自动驾驶系统中对道路环境的实时理解和分割。
在 IDD 20K 评估集上达到 0.7180 的平均交并比(mIoU)。
智能交通系统
交通元素监测
识别和统计道路上的车辆、行人等交通参与者。
骑行者识别准确率达 0.8434,行人识别准确率达 0.8057。