A

Ast Finetuned Audioset 10 10 0.4593 Finetuned Gtzan

由 abnerh 开发
该模型是基于 Audio Spectrogram Transformer (AST) 在 GTZAN 音乐分类数据集上微调的版本,用于音频分类任务,准确率达到 88%。
下载量 2
发布时间 : 10/16/2024
模型介绍
内容详情
替代品

模型简介

这是一个基于 Transformer 架构的音频分类模型,专门针对音乐流派分类任务进行了微调。

模型特点

高准确率
在 GTZAN 数据集上达到 88% 的分类准确率
基于 Transformer 架构
采用 Audio Spectrogram Transformer 架构,适用于音频信号处理
预训练+微调
先在 AudioSet 数据集上预训练,再在 GTZAN 数据集上微调

模型能力

音乐流派分类
音频特征提取
音频信号分析

使用案例

音乐分析
音乐流派自动分类
自动识别音频文件的音乐流派
准确率 88%
音乐推荐系统
作为音乐推荐系统的特征提取组件
音频处理
音频内容分析
分析音频内容特征