W

Wav2vec2 Base Drum Kit Sounds

由 DunnBC22 开发
基于facebook/wav2vec2-base微调的多类别音频分类模型,用于识别鼓类乐器声音
下载量 15
发布时间 : 1/23/2023
模型介绍
内容详情
替代品

模型简介

该模型能够识别音频样本中敲击的鼓类乐器类型,包括底鼓(kick)、悬镲(overheads)、军鼓(snare)和通鼓(toms)。

模型特点

高精度分类
在评估集上达到78.12%的准确率,能够有效区分不同鼓类乐器声音
基于wav2vec2架构
利用强大的wav2vec2-base模型进行微调,继承了其优秀的音频特征提取能力
多指标评估
提供包括准确率、F1值、召回率和精确率在内的全面评估指标

模型能力

音频分类
鼓类乐器识别
音频特征提取

使用案例

音乐制作
自动鼓类乐器分类
在音乐制作过程中自动识别和分类录音中的鼓类乐器
准确率达到78.12%
音乐教育
鼓类乐器学习辅助
帮助学习者识别和区分不同鼓类乐器的声音