X

Xls R Et V 3

由 vasilis 开发
该模型是基于facebook/wav2vec2-xls-r-1b在爱沙尼亚语数据集上微调的自动语音识别模型
下载量 41
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个针对爱沙尼亚语优化的自动语音识别(ASR)模型,在Common Voice 8.0数据集上微调,适用于语音转文字任务

模型特点

大规模预训练模型微调
基于10亿参数的XLS-R模型进行爱沙尼亚语专门优化
多数据集评估
在Common Voice和鲁棒语音事件等多个数据集上进行性能验证
混合精度训练
使用Native AMP技术提高训练效率

模型能力

爱沙尼亚语语音识别
语音转文字
处理不同口音和噪声环境

使用案例

语音转录
语音备忘录转录
将爱沙尼亚语语音备忘录转换为文字
CER 12.59% (Common Voice测试集)
语音助手
爱沙尼亚语语音指令识别
用于爱沙尼亚语语音助手的前端语音识别
WER 52.47% (Common Voice测试集)