W

Wav2vec2 2 Gpt2 Regularisation

由 sanchit-gandhi 开发
这是一个基于 LibriSpeech 数据集训练的自动语音识别(ASR)模型,能够将英语语音转换为文本。
下载量 20
发布时间 : 3/17/2022
模型介绍
内容详情
替代品

模型简介

该模型是在 LibriSpeech ASR 数据集上从头开始训练的自动语音识别模型,主要用于英语语音转文本任务。

模型特点

高准确率
在 LibriSpeech 评估集上取得了较低的词错误率(WER)
端到端训练
模型是从头开始训练的,不依赖于预训练模型
优化训练
使用了 Adam 优化器和线性学习率调度器进行训练

模型能力

英语语音识别
连续语音转文本
大规模语音数据处理

使用案例

语音转录
有声书转录
将英语有声读物自动转录为文本
词错误率约为 0.9977
会议记录
自动记录英语会议内容
语音助手
语音命令识别
识别英语语音命令