W

Wav2vec2 Large Xls R 300m Ru

由 mobedkova 开发
这是一个基于Wav2Vec2 XLS-R架构的俄语自动语音识别模型,参数规模为300m,在公共语音和鲁棒语音事件数据集上进行了评估。
下载量 37
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型主要用于俄语语音识别任务,能够将俄语语音转换为文本。

模型特点

高性能俄语语音识别
在公共语音-7.0俄语数据集上取得了27.81%的词错误率和8.83%的字错误率。
鲁棒性表现
在鲁棒语音事件数据集上表现良好,开发数据和测试数据的词错误率分别为44.64%和42.51%。
基于Wav2Vec2 XLS-R架构
采用先进的Wav2Vec2 XLS-R架构,具有强大的语音特征提取能力。

模型能力

俄语语音识别
语音转文本

使用案例

语音转录
俄语会议记录
将俄语会议录音自动转录为文字记录
词错误率27.81%(公共语音数据集)
俄语语音助手
用于俄语语音助手的语音识别模块
语音分析
俄语语音内容分析
分析俄语语音内容,提取关键信息