V

Vit Base Violence Detection

由 jaranohaal 开发
基于Vision Transformer(ViT)架构优化的暴力行为检测模型,能够将图像分类为暴力或非暴力场景。
下载量 2,140
发布时间 : 6/19/2024
模型介绍
内容详情
替代品

模型简介

该模型以google/vit-base-patch16-224-in21k为基础,使用现实生活暴力场景数据集进行训练,适用于内容审核、视频监控等场景。

模型特点

高准确率
测试准确率达到98.80%,能够有效识别暴力场景。
基于ViT架构
采用Vision Transformer架构,具有优秀的图像处理能力。
专业数据集训练
使用现实生活暴力场景数据集进行训练,识别效果更贴近实际应用。

模型能力

图像分类
暴力场景识别
内容审核

使用案例

安全监控
视频监控系统
实时监控视频流,自动识别暴力行为并报警。
提高监控效率,减少人工审核成本。
内容管理
社交媒体内容审核
自动检测用户上传的图片或视频中是否包含暴力内容。
帮助平台快速识别并处理违规内容。
家长控制
儿童保护软件
过滤含有暴力内容的图像和视频。
保护儿童免受不良内容影响。