W

Wav2vec2 Large Xls R 300m Romansh Sursilvan

由 infinitejoy 开发
基于facebook/wav2vec2-xls-r-300m在罗曼什语苏塞尔瓦方言数据集上微调的自动语音识别模型
下载量 15
发布时间 : 3/2/2022

模型简介

这是一个针对罗曼什语苏塞尔瓦方言的自动语音识别(ASR)模型,基于XLS-R-300M架构微调,在Common Voice 7数据集上取得了19.81%的词错误率(WER)。

模型特点

低词错误率
在罗曼什语苏塞尔瓦方言测试集上取得19.81%的WER和4.15%的CER
基于XLS-R架构
使用强大的XLS-R-300M作为基础模型,具有良好的语音表示能力
针对低资源语言优化
专门为罗曼什语苏塞尔瓦方言这种相对低资源的语言进行优化

模型能力

语音转文本
罗曼什语苏塞尔瓦方言识别
连续语音识别

使用案例

语音转录
罗曼什语语音转录
将罗曼什语苏塞尔瓦方言的语音内容转换为文本
词错误率19.81%,字符错误率4.15%
语音助手
罗曼什语语音指令识别
用于支持罗曼什语的语音助手和智能设备
AIbase
智启未来,您的人工智能解决方案智库
简体中文