W

Wav2vec2 Large Xls R 300m Hsb V1

由 DrishtiSharma 开发
这是一个基于facebook/wav2vec2-xls-r-300m在上索布语(HSB)数据集上微调的自动语音识别模型,在Common Voice 8测试集上取得了0.4393的词错误率(WER)。
下载量 20
发布时间 : 3/2/2022

模型简介

该模型专门用于上索布语的自动语音识别任务,基于wav2vec2架构,在Mozilla Common Voice 8数据集上训练。

模型特点

低资源语言支持
专门为上索布语这种低资源语言优化的语音识别模型
基于XLS-R架构
使用Facebook的wav2vec2-XLS-R-300M作为基础模型,具有强大的跨语言表示能力
在Common Voice上微调
在Mozilla Common Voice 8的上索布语数据集上进行微调,适应特定语言特征

模型能力

上索布语语音识别
语音转文本

使用案例

语音转录
上索布语语音转录
将上索布语的语音内容转换为文本
在Common Voice测试集上WER为0.4393
语言保护
少数民族语言数字化
帮助保存和数字化上索布语等少数民族语言
AIbase
智启未来,您的人工智能解决方案智库
简体中文