W

Wav2vec2 Large Xls R 300m Hsb V3

由 DrishtiSharma 开发
基于facebook/wav2vec2-xls-r-300m在上索布语(hsb)数据集上微调的自动语音识别模型
下载量 18
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是针对上索布语的自动语音识别系统,在Common Voice 8数据集上进行了微调,能够将上索布语语音转换为文本。

模型特点

上索布语优化
专门针对上索布语进行微调,在该语言上表现优异
基于大规模预训练模型
基于facebook的wav2vec2-xls-r-300m模型进行微调,继承了其强大的语音特征提取能力
多场景适用
在Common Voice数据集上表现良好,适用于多种语音识别场景

模型能力

上索布语语音识别
语音转文本
对话语音处理

使用案例

语音转录
上索布语语音转录
将上索布语语音内容转换为文本
在测试集上WER为0.476,CER为0.112
语音助手
上索布语语音助手
为上索布语用户提供语音交互能力