W

Wav2vec2 Gpt2 Wandb Grid Search

由 sanchit-gandhi 开发
基于LibriSpeech数据集训练的自动语音识别(ASR)模型
下载量 13
发布时间 : 3/2/2022

模型简介

该模型是从LibriSpeech数据集从头训练的自动语音识别系统,用于将英语语音转换为文本

模型特点

LibriSpeech数据集训练
基于大规模公开的英语语音数据集训练,具有良好的通用性
自动语音识别
能够将英语语音准确转换为文本
优化的训练参数
使用Adam优化器和线性学习率调度器进行高效训练

模型能力

英语语音识别
语音转文本

使用案例

语音转录
音频转录
将英语语音内容转换为可编辑的文本格式
辅助工具
字幕生成
为英语视频内容自动生成字幕
AIbase
智启未来,您的人工智能解决方案智库
简体中文