ast-finetuned-audioset开源音频分类模型 - 免费部署精准识别音乐流派

Ast Finetuned Audioset 10 10 0.4593 Finetuned Gtzan

由 nomad-ai 开发

这是一个基于AST(Audio Spectrogram Transformer)架构的音频分类模型，在GTZAN音乐流派分类数据集上进行了微调。

下载量 15

发布时间 : 8/9/2023

模型简介

该模型专门用于音乐流派分类任务，能够识别10种不同的音乐流派。基于Transformer架构处理音频频谱图，在GTZAN数据集上达到了90%的准确率。

高准确率

在GTZAN音乐流派分类任务上达到90%的准确率

基于Transformer架构

使用Audio Spectrogram Transformer处理音频频谱，有效捕捉音频特征

预训练+微调

先在AudioSet数据集上预训练，再在GTZAN数据集上微调

音乐流派分类

音频特征提取

音频内容分析

音乐服务

音乐自动分类

为音乐流媒体平台自动分类上传的音乐文件

准确识别10种不同音乐流派

播放列表生成

基于音乐流派自动生成个性化播放列表

音乐研究

音乐风格分析

辅助音乐学研究分析不同音乐风格特征

属性	详情
模型类型	ast-finetuned-audioset-10-10-0.4593-finetuned-gtzan
基础模型	MIT/ast-finetuned-audioset-10-10-0.4593
生成标签	generated_from_trainer
训练数据集	marsyas/gtzan
评估指标	准确率