ast-finetuned-audioset开源音频分类模型 - 精准完成音乐流派分类任务

Ast Finetuned Audioset 10 10 0.4593 Finetuned Gtzan

由 vineetsharma 开发

基于AST架构的音频分类模型，在GTZAN数据集上微调，用于音乐流派分类任务

下载量 14

发布时间 : 7/2/2023

模型简介

该模型是基于Audio Spectrogram Transformer (AST)架构的音频分类模型，先在AudioSet数据集上预训练，后在GTZAN音乐数据集上微调，专门用于音乐流派分类任务。

高准确率

在GTZAN测试集上达到91%的准确率

基于Transformer架构

使用Audio Spectrogram Transformer处理音频频谱特征

两阶段训练

先在AudioSet大规模数据集预训练，后在GTZAN音乐数据集微调

音乐流派分类

音频特征提取

频谱分析

音乐分析

音乐流派自动分类

对音乐片段进行流派分类

准确率91%

音乐推荐系统

作为音乐推荐系统的特征提取组件

音频处理

音频内容分析

分析音频内容特征