W

Wav2vec2 Large Xlsr 53 Rm Vallader

由 anuragshas 开发
基于facebook/wav2vec2-large-xlsr-53模型微调的罗曼什语瓦拉迪尔方言语音识别模型,词错误率32.89%
下载量 58
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是针对罗曼什语瓦拉迪尔方言优化的自动语音识别(ASR)模型,基于通用语音数据集微调,支持16kHz采样率的语音输入识别。

模型特点

低资源语言支持
专门针对较少使用的罗曼什语瓦拉迪尔方言优化
无需语言模型
可直接使用,不需要额外的语言模型支持
16kHz采样率支持
适配常见语音输入设备的采样率标准

模型能力

语音识别
音频转文本
罗曼什语处理

使用案例

语音转录
方言语音转录
将罗曼什语瓦拉迪尔方言的语音内容转换为文本
词错误率32.89%
语言保护
少数民族语言数字化
帮助记录和保护濒危的罗曼什语方言