A

Ast Finetuned Audioset 10 10 0.4593 Finetuned Gtzan

由 vineetsharma 开发
基于AST架构的音频分类模型,在GTZAN数据集上微调,用于音乐流派分类任务
下载量 14
发布时间 : 7/2/2023
模型介绍
内容详情
替代品

模型简介

该模型是基于Audio Spectrogram Transformer (AST)架构的音频分类模型,先在AudioSet数据集上预训练,后在GTZAN音乐数据集上微调,专门用于音乐流派分类任务。

模型特点

高准确率
在GTZAN测试集上达到91%的准确率
基于Transformer架构
使用Audio Spectrogram Transformer处理音频频谱特征
两阶段训练
先在AudioSet大规模数据集预训练,后在GTZAN音乐数据集微调

模型能力

音乐流派分类
音频特征提取
频谱分析

使用案例

音乐分析
音乐流派自动分类
对音乐片段进行流派分类
准确率91%
音乐推荐系统
作为音乐推荐系统的特征提取组件
音频处理
音频内容分析
分析音频内容特征