T

Testv4

由 anderloh 开发
基于wav2vec预训练模型在superb数据集上微调的5分类音频分类模型
下载量 27
发布时间 : 6/20/2024
模型介绍
内容详情
替代品

模型简介

该模型是wav2vec预训练模型在superb数据集上的微调版本,主要用于音频分类任务,在验证集上准确率达到62.09%

模型特点

基于wav2vec预训练
利用wav2vec强大的语音表示能力进行迁移学习
5分类音频识别
能够对音频数据进行5种不同类别的分类
中等准确率
在验证集上达到62.09%的准确率

模型能力

音频分类
语音特征提取

使用案例

语音分析
语音情感识别
识别语音中的情感类别
准确率62.09%
语音指令分类
对语音指令进行分类处理