X

Xls R Et

由 shpotes 开发
基于wav2vec2-xls-r-300m架构微调的爱沙尼亚语自动语音识别模型,在Common Voice 7.0数据集上训练
下载量 23
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是针对爱沙尼亚语优化的自动语音识别(ASR)系统,能够将爱沙尼亚语音频转换为文本

模型特点

多数据集验证
在Common Voice 7.0和鲁棒语音赛事数据集上进行了全面评估
高效训练
使用混合精度训练和余弦学习率调度优化训练过程
低字符错误率
在测试集上达到7.54%的字错误率(CER)

模型能力

爱沙尼亚语音频转文本
语音识别
语音转录

使用案例

语音转录
语音备忘录转录
将爱沙尼亚语语音备忘录转换为可搜索的文本
在Common Voice测试集上达到34.75%的词错误率
辅助技术
语音输入系统
为爱沙尼亚语用户提供语音输入支持