W

Wav2vec2 Large Xls R 300m Hsb V2

由 DrishtiSharma 开发
这是一个基于Facebook的wav2vec2-xls-r-300m模型在上索布语(HSB)数据集上微调的自动语音识别(ASR)模型。
下载量 19
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型专门用于上索布语的语音识别任务,在Common Voice 8数据集上进行了微调,能够将上索布语语音转换为文本。

模型特点

上索布语专用
专门为上索布语优化的语音识别模型
基于大规模预训练模型
基于Facebook的wav2vec2-xls-r-300m模型微调,具备强大的语音特征提取能力
相对较高的识别准确率
在Common Voice 8测试集上达到46.5%的词错误率(WER)和11.4%的字错误率(CER)

模型能力

上索布语语音识别
语音转文本
自动语音转录

使用案例

语音转录
上索布语语音转录
将上索布语语音内容转换为文本
在Common Voice 8测试集上WER为46.5%
语言保护
少数民族语言数字化
帮助保存和数字化上索布语等少数民族语言