X

Xls R 2B Te

由 chmanoj 开发
这是一个基于facebook/wav2vec2-xls-r-2b模型微调的泰卢固语自动语音识别(ASR)模型,在OpenSLR SLR66数据集上训练
下载量 20
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型专门用于泰卢固语的语音识别任务,能够将泰卢固语语音转换为文本

模型特点

高精度泰卢固语识别
在测试集上达到0.51的词错误率(WER)和0.097的字符错误率(CER)
基于XLS-R架构
使用facebook的wav2vec2-xls-r-2b作为基础模型进行微调
公开数据集训练
使用OpenSLR SLR66公开数据集进行训练

模型能力

泰卢固语语音识别
语音转文本
鲁棒语音处理

使用案例

语音转录
泰卢固语会议记录
将泰卢固语会议录音自动转录为文字记录
准确率约90.3%(基于1-CER)
语音助手
为泰卢固语用户提供语音交互功能
教育
语言学习辅助
帮助学习者检查泰卢固语发音准确性