V

Voice Gender Classifier

由 JaesungHuh 开发
基于ECAPA-TDNN架构的预训练模型,用于从人类语音中分类性别
下载量 14.01k
发布时间 : 5/13/2024
模型介绍
内容详情
替代品

模型简介

该模型使用预训练的ECAPA-TDNN架构进行微调,专门用于从语音中识别说话者的性别。在VoxCeleb1测试集上达到98.7%的准确率。

模型特点

高准确率
在VoxCeleb1测试集上达到98.7%的准确率
基于ECAPA-TDNN
使用最先进的说话人验证模型架构
简单易用
提供直接的预测接口,只需输入音频文件即可获取结果

模型能力

语音性别分类
音频特征提取

使用案例

语音分析
说话者性别识别
从语音片段中识别说话者的性别
98.7%的准确率(VoxCeleb1测试集)
语音处理预处理
语音数据分类
在语音处理流程中预先分类语音性别