W

Wav2vec2 Large Uralic Voxpopuli V2

由 facebook 开发
基于VoxPopuli语料库的42.5小时乌拉尔语系无标注数据预训练的Wav2Vec2大型语音模型
下载量 46
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个基于Facebook Wav2Vec2架构的大型语音模型,专门针对乌拉尔语系进行预训练,适用于语音识别任务。

模型特点

乌拉尔语系专用
专门针对乌拉尔语系进行预训练,适用于该语系的语音识别任务
基于VoxPopuli语料库
使用VoxPopuli多语言语音语料库中的42.5小时乌拉尔语系数据进行预训练
16kHz音频支持
模型预训练使用16kHz采样率的语音音频,使用时需确保输入音频匹配此采样率

模型能力

语音特征提取
语音表示学习

使用案例

语音技术
乌拉尔语系语音识别
可用于开发乌拉尔语系的自动语音识别系统
需在标注数据上进行微调后才能获得最佳效果