W

Wav2vec2 Large 100k Voxpopuli Ft Common Voice Plus TTS Dataset Russian

由 Edresson 开发
这是一个基于Facebook的wav2vec2-large-100k-voxpopuli模型,使用Common Voice 7.0和M-AILABS俄语数据进行微调的语音识别模型。
下载量 25
发布时间 : 3/2/2022

模型简介

该模型主要用于俄语语音识别任务,能够将俄语语音转换为文本。

模型特点

高精度俄语语音识别
在Common Voice 7.0俄语测试集上达到24.80%的词错误率(WER)。
多数据源训练
结合了Common Voice和M-AILABS两个高质量的俄语语音数据集进行微调。
基于Transformer架构
采用先进的wav2vec2架构,具有强大的语音特征提取能力。

模型能力

俄语语音识别
语音转文本
音频处理

使用案例

语音转录
俄语语音转写
将俄语语音内容转换为文本格式
词错误率24.80%
语音助手
俄语语音指令识别
用于俄语语音助手或智能家居设备的语音指令识别
AIbase
智启未来,您的人工智能解决方案智库
简体中文