W

Wav2vec2 Xls R Myv A1

由 DrishtiSharma 开发
该模型是基于facebook/wav2vec2-xls-r-300m在Erzya语言(MYV)数据集上微调的自动语音识别(ASR)模型,在Common Voice 8测试集上取得了65.15%的词错误率(WER)。
下载量 24
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个针对Erzya语言的自动语音识别模型,基于wav2vec2 XLS-R架构微调,适用于将Erzya语音转换为文本的任务。

模型特点

多语言支持
专门针对Erzya语言优化,适用于低资源语言的语音识别任务
基于XLS-R架构
采用Facebook的wav2vec2 XLS-R 300M参数模型作为基础,具有强大的语音特征提取能力
在Common Voice数据集上微调
使用Mozilla Common Voice 8.0的Erzya语言数据进行微调,适应特定语言特点

模型能力

语音转文本
Erzya语言识别
自动语音识别

使用案例

语音转写
Erzya语音转录
将Erzya语言的语音内容转换为文本
在测试集上达到65.15%的词错误率(WER)
语言保护
少数民族语言数字化
帮助记录和数字化Erzya等少数民族语言的语音资料