X

Xls R 1B Te

由 chmanoj 开发
基于facebook/wav2vec2-xls-r-1b在OPENSLR_SLR66-NA数据集上微调的泰卢固语语音识别模型,支持自动语音识别任务。
下载量 18
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是针对泰卢固语优化的自动语音识别系统,基于XLS-R架构,在OpenSLR的SLR66数据集上微调,适用于泰卢固语语音转文本任务。

模型特点

高精度泰卢固语识别
在测试集上达到20.624%的词错误率(WER)和3.979%的字错误率(CER)
大规模预训练基础
基于facebook/wav2vec2-xls-r-1b模型微调,继承了大规模预训练模型的强大特征提取能力
支持语言模型解码
可通过集成语言模型进一步提升识别准确率,WER从26.14%提升至20.69%

模型能力

泰卢固语语音识别
语音转文本
支持语言模型集成

使用案例

语音转录
泰卢固语语音转录
将泰卢固语语音内容转换为文本
在测试集上达到20.624% WER
语音助手
泰卢固语语音交互
为泰卢固语用户提供语音交互能力