ast-finetuned-audioset开源音频分类模型 - 基于GTZAN微调，准确率达88%

Ast Finetuned Audioset 10 10 0.4593 Finetuned Gtzan

由 abnerh 开发

该模型是基于 Audio Spectrogram Transformer (AST) 在 GTZAN 音乐分类数据集上微调的版本，用于音频分类任务，准确率达到 88%。

下载量 2

发布时间 : 10/16/2024

模型简介

这是一个基于 Transformer 架构的音频分类模型，专门针对音乐流派分类任务进行了微调。

高准确率

在 GTZAN 数据集上达到 88% 的分类准确率

基于 Transformer 架构

采用 Audio Spectrogram Transformer 架构，适用于音频信号处理

预训练+微调

先在 AudioSet 数据集上预训练，再在 GTZAN 数据集上微调

音乐流派分类

音频特征提取

音频信号分析

音乐分析

音乐流派自动分类

自动识别音频文件的音乐流派

准确率 88%

音乐推荐系统

作为音乐推荐系统的特征提取组件

音频处理

音频内容分析

分析音频内容特征

任务	数据集	评估指标	值
音频分类	GTZAN（marsyas/gtzan，训练集 all 配置）	准确率	0.88