E

Exp W2v2t En No Pretraining S289

由 jonatasgrosman 开发
这是一个针对英语语音识别任务的模型,基于随机初始化的wav2vec2架构,使用Common Voice 7.0数据集进行微调。
下载量 18
发布时间 : 7/8/2022
模型介绍
内容详情
替代品

模型简介

该模型主要用于英语语音识别任务,能够将英语语音转换为文本。

模型特点

随机初始化训练
模型从随机初始化的wav2vec2架构开始训练,而非使用预训练权重。
16kHz采样率支持
模型要求输入语音的采样率为16kHz,确保语音识别的准确性。

模型能力

英语语音识别
语音转文本

使用案例

语音转录
语音转写
将英语语音内容转换为文本格式,适用于会议记录、语音笔记等场景。