W

Wespeaker Voxceleb Resnet34 LM

由 Wespeaker 开发
基于ResNet34架构的说话人嵌入模型,经过大间隔微调,在VoxCeleb2数据集上训练,支持说话人识别和相似度计算等任务。
下载量 33
发布时间 : 2/26/2024
模型介绍
内容详情
替代品

模型简介

该模型用于提取说话人特征嵌入,支持说话人识别、相似度计算和语音分割等任务。

模型特点

大间隔微调
模型经过大间隔微调,提高了说话人识别的准确率。
高效推理
模型参数量适中,计算量为4.55G,适合实际应用部署。
多功能支持
支持说话人嵌入提取、相似度计算、语音分割等多种任务。

模型能力

说话人特征提取
说话人相似度计算
语音分割
说话人识别
说话人注册与验证

使用案例

安全认证
声纹识别系统
用于身份验证的声纹识别系统
在VoxCeleb测试集上达到0.723的EER(等错误率)
语音分析
会议语音分割
自动分割会议录音中不同说话人的片段