W

Wav2vec2 2 Bart Base

由 patrickvonplaten 开发
基于wav2vec2-base和bart-base在LibriSpeech ASR clean数据集上微调的语音识别模型
下载量 493
发布时间 : 3/2/2022

模型简介

该模型结合了wav2vec2的语音特征提取能力和BART的序列到序列转换能力,专注于英语语音识别任务

模型特点

混合架构
结合了wav2vec2的语音特征提取和BART的序列转换能力
高效微调
在LibriSpeech ASR clean数据集上进行了优化
多GPU训练
支持分布式训练,提高训练效率

模型能力

英语语音识别
音频转文本
序列到序列转换

使用案例

语音转录
会议记录
将会议录音转换为文字记录
播客转录
将播客音频内容转换为文本
辅助技术
实时字幕生成
为视频或直播生成实时字幕
AIbase
智启未来,您的人工智能解决方案智库
简体中文