W

Wav2vec2 Base Superb Sid

由 superb 开发
基于Wav2Vec2-base预训练模型,在VoxCeleb1数据集上微调的说话人识别模型,用于语音分类任务
下载量 1,489
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是S3PRL的Wav2Vec2在SUPERB说话人识别任务的移植版本,能够将每段语音按其说话人身份进行多分类

模型特点

基于Wav2Vec2预训练模型
使用facebook/wav2vec2-base作为基础模型,该模型基于16kHz采样的语音音频进行预训练
VoxCeleb1数据集微调
在广泛使用的VoxCeleb1数据集上进行微调,适用于说话人识别任务
高准确率
在测试集上达到75.18%的准确率

模型能力

说话人识别
语音分类
音频特征提取

使用案例

安全验证
声纹识别系统
用于身份验证系统的说话人识别
可识别特定说话人身份
语音分析
会议记录分析
识别会议录音中不同发言人的语音片段
自动区分不同说话人