W

Wav2vec2 FR 3K Base

由 LeBenchmark 开发
基于2.9K小时法语语音训练的wav2vec2基础模型,支持自发、朗读和广播语音
下载量 31
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

LeBenchmark提供的wav2vec2基础模型,在包含自发、朗读和广播语音的不同法语数据集上预训练,适用于语音相关任务

模型特点

多场景语音训练
模型在包含自发、朗读和广播语音的不同法语数据集上预训练,适应多种语音场景
多种规模选择
提供从1K到14K小时不同规模的预训练模型,满足不同计算资源需求
开源许可
模型根据Apache-2.0许可证分发,可以广泛重用

模型能力

语音特征提取
语音表示学习
自动语音识别
说话人识别

使用案例

语音处理
自动语音识别(ASR)
使用CTC对模型进行ASR微调
由于CTC的性质,语音到文本的结果预计不会是最先进的
说话人识别
结合SpeechBrain工具包进行说话人识别或验证