A

Asr Wav2vec2 Commonvoice Fr

由 speechbrain 开发
基于CommonVoice法语数据集训练的wav2vec 2.0语音识别模型,使用CTC/Attention架构,无需语言模型
下载量 250
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个端到端的法语自动语音识别系统,基于预训练的wav2vec 2.0模型微调,适用于法语语音转文本任务。

模型特点

预训练模型微调
基于LeBenchmark/wav2vec2-FR-7K-large预训练模型进行微调,提高了法语识别准确率
无需语言模型
系统直接使用CTC贪婪解码器,不需要额外的语言模型支持
高效训练
使用2块V100 32GB GPU即可完成训练,资源消耗相对较低

模型能力

法语语音识别
音频转录
16kHz采样率处理

使用案例

语音转文本
法语语音转录
将法语语音内容转换为文本
测试WER 9.96%,CER 3.19%