X

Xls R 300m Te

由 chmanoj 开发
基于facebook/wav2vec2-xls-r-300m在OpenSLR SLR66泰卢固语数据集上微调的自动语音识别模型
下载量 25
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是针对泰卢固语的自动语音识别(ASR)系统,能够将泰卢固语语音转换为文本。

模型特点

高精度泰卢固语识别
在OpenSLR SLR66测试集上达到24.7%的词错误率和4.86%的字错误率
基于XLS-R架构
使用facebook的wav2vec2-xls-r-300m作为基础模型,具有强大的语音特征提取能力
开源许可
采用Apache-2.0许可证,允许商业和研究用途

模型能力

泰卢固语语音识别
语音转文本
支持长音频处理

使用案例

语音转录
泰卢固语会议记录
将泰卢固语会议录音自动转换为文字记录
准确率约75.3%(基于WER指标)
语音助手
为泰卢固语用户提供语音交互功能
教育
语言学习辅助
帮助学习者练习泰卢固语发音和听力