W

Wav2vec2 Base En Voxpopuli V2

由 facebook 开发
基于VoxPopuli语料库的24.1k无标注英语数据预训练的Wav2Vec2基础模型,适用于语音识别任务。
下载量 35
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是Facebook的Wav2Vec2基础版本,专门针对英语语音数据进行预训练,主要用于自动语音识别(ASR)任务。

模型特点

基于VoxPopuli语料库
使用VoxPopuli语料库中的24.1k无标注英语数据进行预训练,专注于英语语音识别。
16kHz采样率
模型在16kHz采样的语音音频上进行预训练,使用时需确保输入音频为相同采样率。
无分词器
该模型仅基于音频进行预训练,未配备分词器,需额外创建并在标注文本数据上进行微调。

模型能力

语音识别
英语语音处理

使用案例

语音识别
英语语音转文本
将英语语音转换为文本,适用于语音助手、转录服务等场景。