W

Wav2vec2 Large Xls R 300m Sl With LM V1

由 DrishtiSharma 开发
这是一个基于facebook/wav2vec2-xls-r-300m模型在斯洛文尼亚语(Common Voice 8.0)数据集上微调的自动语音识别(ASR)模型,结合语言模型(LM)提升了识别效果。
下载量 25
发布时间 : 3/2/2022

模型简介

该模型专门用于斯洛文尼亚语的语音识别任务,在Common Voice 8.0数据集上取得了较好的识别准确率。

模型特点

语言模型增强
结合语言模型(LM)显著提升了识别准确率,WER从20.6%降至13.5%
多数据集验证
在Common Voice和鲁棒语音事件等多个数据集上进行了验证
高效训练
使用混合精度训练和线性学习率调度器优化训练过程

模型能力

斯洛文尼亚语语音识别
长音频处理(支持分块处理)
高准确率字符识别(CER 3.8%)

使用案例

语音转文字
语音转录
将斯洛文尼亚语语音转换为文字
在Common Voice测试集上WER 13.5%
语音助手
语音指令识别
识别斯洛文尼亚语语音命令
在鲁棒语音事件测试集上WER 46.17%
AIbase
智启未来,您的人工智能解决方案智库
简体中文