W

Whisper Tiny

由 openai 开发
Whisper Tiny是OpenAI开发的自动语音识别(ASR)模型,属于Whisper系列中最小的版本,参数规模为39M。
下载量 328.82k
发布时间 : 9/26/2022
模型介绍
内容详情
替代品

模型简介

Whisper是一个基于Transformer的编码器-解码器模型,用于自动语音识别和语音翻译任务。该模型在68万小时的标注语音数据上训练,展现出强大的泛化能力。

模型特点

大规模弱监督训练
在68万小时的标注语音数据上训练,具有强大的泛化能力
多语言支持
支持多种语言的语音识别和翻译任务
无需微调
在许多数据集和领域上表现良好,无需进行微调
轻量级模型
Tiny版本仅有39M参数,适合资源有限的环境

模型能力

语音识别
语音翻译
多语言处理

使用案例

语音转录
会议记录
将会议录音自动转录为文字记录
在LibriSpeech测试集上WER为7.54(clean)和17.15(other)
播客转录
将播客内容转录为可搜索的文本
语音翻译
实时翻译
将一种语言的语音实时翻译为另一种语言的文本