W

Wav2vec2 Large Xlsr 53 Gender Recognition Librispeech

由 alefiury 开发
基于Librispeech-clean-100数据集微调的性别识别模型,在测试集上F1分数达0.9993
下载量 182.33k
发布时间 : 4/24/2023
模型介绍
内容详情
替代品

模型简介

该模型是基于wav2vec2-xls-r-300m架构的语音性别识别模型,专门用于从语音中识别说话者性别

模型特点

高精度性别识别
在Librispeech测试集上达到99.93%的F1分数
基于预训练模型微调
利用facebook/wav2vec2-xls-r-300m预训练模型进行迁移学习
高效训练配置
采用混合精度训练和梯度累积等技术优化训练效率

模型能力

语音性别分类
英语语音处理

使用案例

语音分析
说话者性别识别
从语音片段中识别说话者性别
测试集F1分数0.9993