ast-finetuned-audioset开源音频分类模型 - 精准完成音乐分类，准确率达89%

Ast Finetuned Audioset 10 10 0.4593 Finetuned Gtzan

由 eonrad 开发

该模型是基于AST架构在GTZAN音乐分类数据集上微调的音频分类模型，准确率达89%

下载量 1

发布时间 : 10/25/2024

模型简介

基于Audio Spectrogram Transformer (AST)架构的音频分类模型，专门针对音乐流派分类任务进行了微调

高准确率

在GTZAN音乐分类数据集上达到89%的准确率

基于Transformer架构

采用Audio Spectrogram Transformer处理音频频谱图

迁移学习

在AudioSet预训练模型基础上进行微调

音乐流派分类

音频特征提取

频谱图分析

音乐分析

音乐流派自动分类

自动识别音频文件的音乐流派

在GTZAN数据集上达到89%准确率

音频内容分析

音频内容分类

对音频内容进行分类和标记

属性	详情
库名称	transformers
许可证	bsd-3-clause
基础模型	MIT/ast-finetuned-audioset-10-10-0.4593
标签	generated_from_trainer
数据集	marsyas/gtzan
评估指标	准确率
模型名称	ast-finetuned-audioset-10-10-0.4593-finetuned-gtzan
任务类型	音频分类
数据集名称	GTZAN
数据集类型	marsyas/gtzan
数据集配置	all
数据集分割	train
数据集参数	all
评估指标值	0.89（准确率）