W

Whisper Small.en

由 openai 开发
Whisper是一个预训练的自动语音识别(ASR)模型,在68万小时的标注数据上训练,展现出强大的泛化能力。
下载量 20.50k
发布时间 : 9/26/2022
模型介绍
内容详情
替代品

模型简介

基于Transformer的编码器-解码器模型,专门用于英语语音识别任务,无需微调即可适应多种场景。

模型特点

大规模预训练
在68万小时的标注语音数据上训练,涵盖多样化的语音场景
零样本泛化能力
无需微调即可适应多种数据集和领域
鲁棒语音识别
对口音、背景噪音和术语表现出强鲁棒性

模型能力

英语语音识别
长音频转录(通过分块处理)
语音活动检测

使用案例

无障碍工具
实时字幕生成
为听力障碍用户提供实时语音转文字服务
语音分析
会议记录转录
自动转录会议录音为文字记录
在LibriSpeech测试集上WER为3.05%