W

Wav2vec2 Base 100k Gtzan Music Genres

由 m3hrdadfi 开发
基于Wav2Vec 2.0架构的音频分类模型,专门用于音乐流派识别
下载量 405
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型使用Wav2Vec 2.0架构进行音乐流派分类,能够识别10种不同的音乐流派,包括蓝调、古典、乡村、迪斯科等。

模型特点

高精度流派识别
在GTZAN数据集上表现出色,对迪斯科等流派的识别准确率高达99.8%
基于Wav2Vec 2.0架构
利用先进的语音表示学习架构,有效提取音频特征
多流派分类
支持10种不同音乐流派的分类

模型能力

音乐流派识别
音频特征提取
音频分类

使用案例

音乐推荐系统
自动音乐分类
为音乐库中的曲目自动添加流派标签
准确率高达77.5%的流派分类能力
音乐分析
音乐内容分析
分析音乐音频特征,识别其所属流派
提供详细的流派概率分布