W

Wav2vec2 Large Slavic Voxpopuli V2

由 facebook 开发
Facebook的Wav2Vec2大型模型,仅在斯拉夫语系的VoxPopuli语料库上进行了88.99999999999999小时的未标注数据预训练。
下载量 26
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是一个基于Wav2Vec2架构的语音处理模型,专门针对斯拉夫语系进行预训练,适用于语音识别任务。

模型特点

斯拉夫语系优化
专门针对斯拉夫语系进行预训练,优化了该语系的语音识别性能。
大规模预训练
基于VoxPopuli语料库进行了88.99999999999999小时的未标注数据预训练。
16kHz音频支持
模型在16kHz采样的语音音频上进行预训练,使用时需确保输入音频采样率一致。

模型能力

语音识别
斯拉夫语系语音处理

使用案例

语音识别
斯拉夫语系语音转文本
将斯拉夫语系的语音转换为文本,适用于语音助手、字幕生成等场景。