A

Ast Finetuned Audioset 10 10 0.4593 Finetuned Gtzan

由 eonrad 开发
该模型是基于AST架构在GTZAN音乐分类数据集上微调的音频分类模型,准确率达89%
下载量 1
发布时间 : 10/25/2024
模型介绍
内容详情
替代品

模型简介

基于Audio Spectrogram Transformer (AST)架构的音频分类模型,专门针对音乐流派分类任务进行了微调

模型特点

高准确率
在GTZAN音乐分类数据集上达到89%的准确率
基于Transformer架构
采用Audio Spectrogram Transformer处理音频频谱图
迁移学习
在AudioSet预训练模型基础上进行微调

模型能力

音乐流派分类
音频特征提取
频谱图分析

使用案例

音乐分析
音乐流派自动分类
自动识别音频文件的音乐流派
在GTZAN数据集上达到89%准确率
音频内容分析
音频内容分类
对音频内容进行分类和标记