X

Xtreme S Xlsr 300m Voxpopuli En

由 anton-l 开发
该模型是基于facebook/wav2vec2-xls-r-300m在GOOGLE/XTREME_S - VOXPOPULI.EN数据集上微调的语音识别模型,支持英语语音转文本任务。
下载量 28
发布时间 : 4/29/2022
模型介绍
内容详情
替代品

模型简介

这是一个针对英语语音识别任务优化的模型,在VOXPOPULI.EN数据集上微调,能够将英语语音转换为文本。

模型特点

高效语音识别
在VOXPOPULI.EN数据集上微调,针对英语语音识别进行了优化
基于wav2vec2-xls-r架构
采用facebook的wav2vec2-xls-r-300m预训练模型作为基础
多GPU训练优化
支持多GPU分布式训练,提高训练效率

模型能力

英语语音识别
语音转文本
自动语音识别

使用案例

语音转录
会议记录自动转录
将英语会议录音自动转换为文字记录
字符错误率(Cer): 0.0966,词错误率(Wer): 0.1549
播客内容转录
将英语播客内容自动转换为文字稿
辅助技术
实时字幕生成
为英语视频内容生成实时字幕