wav2vec2-large-robust-6开源音频分类模型 - 用于年龄和性别精准识别

Wav2vec2 Large Robust 6 Ft Age Gender Finetuned Gtzan

由 languageresearch 开发

基于wav2vec2架构的音频分类模型，在privateSLI数据集上微调，用于年龄和性别识别任务

下载量 15

发布时间 : 9/20/2023

模型简介

该模型是在privateSLI数据集上对audeering/wav2vec2-large-robust-6-ft-age-gender进行微调的版本，主要用于音频分类任务，特别是年龄和性别识别。

高准确率

在评估集上达到98.32%的准确率

鲁棒性

基于robust版本架构，对噪声环境有更好适应性

特定领域微调

在privateSLI数据集上进行了针对性微调

音频分类

年龄识别

性别识别

人口统计分析

语音样本分析

通过语音样本分析说话人的年龄和性别特征

准确率98.32%

市场研究

消费者画像

通过语音交互分析消费者人口统计特征

属性	详情
基础模型	audeering/wav2vec2-large-robust-6-ft-age-gender
标签	generated_from_trainer
数据集	SLIdataset
评估指标	准确率
模型名称	wav2vec2-large-robust-6-ft-age-gender-finetuned-dataset
任务类型	音频分类
评估数据集	privateSLI（SLIdataset 类型）
准确率	0.9832041343669251