W

Wav2vec2 Large Xls R 300m Br D2

由 DrishtiSharma 开发
基于facebook/wav2vec2-xls-r-300m在布列塔尼语(Common Voice 8.0)上微调的语音识别模型
下载量 21
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个针对布列塔尼语优化的自动语音识别(ASR)模型,基于wav2vec 2.0架构的大规模XLS-R变体,在Common Voice 8.0的布列塔尼语数据集上微调。

模型特点

多语言预训练基础
基于XLS-R-300M多语言预训练模型,具有强大的跨语言迁移能力
布列塔尼语优化
专门针对布列塔尼语进行微调,在Common Voice测试集上WER达到0.4977
高效训练
使用混合精度训练和梯度累积等技术优化训练效率

模型能力

布列塔尼语语音识别
语音转文本

使用案例

语音转录
布列塔尼语语音转录
将布列塔尼语语音内容转换为文本
测试WER 0.4977,CER 0.1809
语言保护
少数民族语言数字化
帮助保护和数字化布列塔尼语等少数民族语言