W

Wav2vec2 Xls R 300m Rm Sursilv D11

由 DrishtiSharma 开发
该模型是基于facebook/wav2vec2-xls-r-300m在罗曼什语-苏塞尔瓦方言数据集上微调的自动语音识别模型,在Common Voice 8测试集上取得了24.09%的词错误率(WER)。
下载量 20
发布时间 : 3/2/2022

模型简介

这是一个用于罗曼什语-苏塞尔瓦方言的自动语音识别模型,基于wav2vec2-xls-r-300m架构微调而成,适用于将语音转换为文本的任务。

模型特点

低资源语言支持
专门针对罗曼什语-苏塞尔瓦方言这一低资源语言进行优化
高性能
在Common Voice 8测试集上取得了24.09%的词错误率(WER)和4.98%的字错误率(CER)
基于XLS-R架构
使用Facebook的wav2vec2-xls-r-300m作为基础模型,具有强大的语音特征提取能力

模型能力

语音识别
语音转文本
罗曼什语-苏塞尔瓦方言处理

使用案例

语音转录
罗曼什语语音转录
将罗曼什语-苏塞尔瓦方言的语音内容转换为文本
在Common Voice 8测试集上WER为24.09%
语音辅助技术
罗曼什语语音助手
为罗曼什语使用者开发语音控制应用
AIbase
智启未来,您的人工智能解决方案智库
简体中文