W

Wav2vec2 Large Romance Voxpopuli V2

由 facebook 开发
Facebook的Wav2Vec2大型模型,仅在罗曼语族的VoxPopuli语料库101.5小时未标注数据上进行预训练,适用于语音识别任务。
下载量 26
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是基于16kHz采样语音音频进行预训练的自动语音识别模型,需配合分词器和标注数据微调后使用。

模型特点

多语言支持
专注于罗曼语族的语音识别,支持多种相关语言。
高效预训练
仅使用101.5小时未标注数据进行预训练,数据效率高。
16kHz音频支持
针对16kHz采样的语音音频优化,确保识别质量。

模型能力

语音特征提取
自动语音识别

使用案例

语音技术
多语言语音识别系统
构建支持罗曼语族的语音识别系统
需配合标注数据微调后使用
语音数据分析
用于罗曼语族语音数据的特征提取和分析