W

Wav2vec2 Large Robust 6 Ft Age Gender Finetuned Gtzan

由 languageresearch 开发
基于wav2vec2架构的音频分类模型,在privateSLI数据集上微调,用于年龄和性别识别任务
下载量 15
发布时间 : 9/20/2023
模型介绍
内容详情
替代品

模型简介

该模型是在privateSLI数据集上对audeering/wav2vec2-large-robust-6-ft-age-gender进行微调的版本,主要用于音频分类任务,特别是年龄和性别识别。

模型特点

高准确率
在评估集上达到98.32%的准确率
鲁棒性
基于robust版本架构,对噪声环境有更好适应性
特定领域微调
在privateSLI数据集上进行了针对性微调

模型能力

音频分类
年龄识别
性别识别

使用案例

人口统计分析
语音样本分析
通过语音样本分析说话人的年龄和性别特征
准确率98.32%
市场研究
消费者画像
通过语音交互分析消费者人口统计特征