D

Digit Mask Data2vec Audio Base 960h Ft

由 mazkooleg 开发
基于data2vec-audio-base-960h微调的音频数字识别模型,在数字掩码增强数据集上表现出色
下载量 14
发布时间 : 5/7/2023
模型介绍
内容详情
替代品

模型简介

该模型是针对音频数字识别任务优化的版本,特别适用于处理数字掩码场景下的音频数据

模型特点

高准确率数字识别
在评估集上达到99.91%的准确率和F1值
针对数字掩码优化
专门针对数字掩码场景进行训练和优化
基于data2vec微调
基于强大的data2vec音频基础模型进行微调

模型能力

音频数字识别
处理掩码音频
高精度分类

使用案例

语音处理
电话数字识别
识别电话语音中的数字输入
99.91%准确率
语音验证码识别
解析语音验证码中的数字序列