E

Exp W2v2t En Vp Nl S281

由 jonatasgrosman 开发
基于facebook/wav2vec2-large-nl-voxpopuli模型微调的英语语音识别模型,使用Common Voice 7.0训练集进行训练。
下载量 18
发布时间 : 7/8/2022
模型介绍
内容详情
替代品

模型简介

该模型是一个英语自动语音识别(ASR)模型,适用于将英语语音转换为文本的任务。

模型特点

基于高质量预训练模型
基于facebook/wav2vec2-large-nl-voxpopuli模型微调,继承了其强大的语音特征提取能力。
使用Common Voice数据集
使用Mozilla Foundation提供的Common Voice 7.0数据集进行训练,数据质量可靠。
16kHz采样率支持
专门优化用于处理16kHz采样率的语音输入。

模型能力

英语语音识别
语音转文本

使用案例

语音转录
会议记录
将英语会议录音自动转换为文字记录
字幕生成
为英语视频内容自动生成字幕
语音助手
语音指令识别
用于英语语音助手系统中的语音指令识别