W

Whisper Tiny.en

由 openai 开发
Whisper是一个预训练的自动语音识别(ASR)模型,在68万小时标注数据上训练,具有强大的泛化能力。
下载量 145.30k
发布时间 : 9/26/2022
模型介绍
内容详情
替代品

模型简介

Whisper是基于Transformer的编码器-解码器模型,专门用于英语语音识别任务。

模型特点

大规模训练
在68万小时的标注语音数据上训练,展现出强大的泛化能力
无需微调
可以直接应用于多种数据集和领域,无需进行微调
鲁棒性
对口音、背景噪音和技术语言表现出较强的鲁棒性

模型能力

英语语音识别
长音频转录(通过分块处理)

使用案例

语音转录
会议记录
将会议录音自动转录为文字记录
播客转录
将英语播客内容转换为文字
辅助工具
听力辅助
为听障人士提供实时语音转文字服务