W

Wav2vec2 Large Xlsr Rm Sursilv

由 gchhablani 开发
这是一个基于facebook/wav2vec2-large-xlsr-53模型微调的自动语音识别模型,专门用于识别罗曼什语的苏塞尔瓦方言。
下载量 27
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型使用Common Voice数据集的罗曼什语苏塞尔瓦方言数据进行微调,适用于语音识别任务,支持16kHz采样率的语音输入。

模型特点

高精度语音识别
在Common Voice测试集上达到25.16%的词错误率(WER)。
低资源语言支持
专门针对罗曼什语的苏塞尔瓦方言进行优化,适用于低资源语言场景。
无需语言模型
可以直接使用,不需要额外的语言模型支持。

模型能力

语音识别
音频转文本
罗曼什语处理

使用案例

语音转录
方言语音转录
将罗曼什语苏塞尔瓦方言的语音转换为文本
词错误率25.16%
语音助手
方言语音助手
为罗曼什语用户提供语音交互能力