H

Hubert Large Superb Sid

由 superb 开发
基于Hubert-Large架构的说话人识别模型,在VoxCeleb1数据集上训练,用于语音分类任务
下载量 349
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是基于Hubert-Large架构的说话人识别系统,专门用于将语音片段分类到特定的说话人身份。模型在16kHz采样的语音数据上预训练,适用于说话人识别任务。

模型特点

高准确率
在VoxCeleb1测试集上达到90.35%的准确率
16kHz采样支持
专门针对16kHz采样的语音数据进行优化
预训练模型微调
基于hubert-large-ll60k预训练模型进行微调

模型能力

说话人识别
语音分类
音频特征提取

使用案例

安全认证
语音生物识别
用于基于语音的身份验证系统
可准确识别注册用户的语音特征
语音分析
说话人区分
在会议记录中区分不同说话人
帮助自动生成带说话人标签的会议记录