A

Audio Class Finetuned

由 Chemsseddine 开发
该模型是基于facebook/wav2vec2-base在superb数据集上微调的音频分类模型,在评估集上取得了0.6578的准确率。
下载量 20
发布时间 : 4/16/2023

模型简介

这是一个用于音频分类的微调模型,基于wav2vec2架构,适用于语音相关的分类任务。

模型特点

基于wav2vec2架构
采用facebook的wav2vec2-base模型作为基础架构,具有良好的音频特征提取能力。
superb数据集微调
在superb音频数据集上进行微调,适用于多种音频分类任务。
中等准确率
在评估集上取得了0.6578的准确率,适合一般音频分类应用。

模型能力

音频分类
语音特征提取

使用案例

语音处理
语音情感识别
可用于识别语音中的情感状态
语音命令分类
可用于识别和分类语音命令
AIbase
智启未来,您的人工智能解决方案智库
简体中文