W

Wav2vec2 Xlsr Tatar

由 sammy786 开发
该模型是基于facebook/wav2vec2-xls-r-1b在鞑靼语数据集上微调得到的自动语音识别模型,在Common Voice 8数据集上取得了16.87%的词错误率(WER)。
下载量 17
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

用于鞑靼语自动语音识别的预训练模型,基于wav2vec2-xls-r-1b架构微调

模型特点

低词错误率
在鞑靼语测试集上达到16.87%的词错误率(WER)和3.64%的字错误率(CER)
基于大规模预训练模型
基于facebook/wav2vec2-xls-r-1b模型微调,继承了其强大的语音特征提取能力
鞑靼语优化
专门针对鞑靼语语音数据进行优化,适用于鞑靼语语音识别场景

模型能力

鞑靼语语音识别
语音转文本
连续语音识别

使用案例

语音转录
鞑靼语语音转写
将鞑靼语语音内容转换为文本
词错误率16.87%,字错误率3.64%
语音助手
鞑靼语语音交互
为鞑靼语语音助手提供语音识别能力