F

Faster Distil Whisper Large V2

由 Systran 开发
这是一个基于Whisper架构的蒸馏版本自动语音识别(ASR)模型,专为高效推理设计,适用于英语语音转文本任务。
下载量 1,336
发布时间 : 1/19/2024
模型介绍
内容详情
替代品

模型简介

该模型是Whisper大型v2模型的蒸馏版本,保留了原始模型的高准确性同时显著提升了推理速度,适用于需要实时语音识别的应用场景。

模型特点

高效推理
通过知识蒸馏技术优化,相比原始Whisper模型显著提升了推理速度
高准确率
保留了原始Whisper大型v2模型的识别准确率
CTranslate2兼容
已转换为CTranslate2格式,可与faster-whisper等高效推理库配合使用
FP16量化
模型权重以FP16格式保存,平衡了精度和性能需求

模型能力

英语语音识别
长音频转录
实时语音转文本

使用案例

语音转录
会议记录自动化
自动将英语会议录音转换为文字记录
高效生成可搜索的会议文本记录
播客转录
将英语播客内容自动转换为文字稿
快速生成可供编辑和发布的文字内容
辅助技术
实时字幕生成
为英语视频或直播提供实时字幕
提升内容可访问性