D

Distil Large V3 Ct2

由 distil-whisper 开发
Distil-Whisper是Whisper模型的蒸馏版本,针对长文本转录进行了优化,提供更快的推理速度和更高的词错误率(WER)性能。
下载量 58
发布时间 : 3/21/2024
模型介绍
内容详情
替代品

模型简介

此模型是转换为CTranslate2格式的distil-large-v3权重,专为兼容OpenAI Whisper的长文本转录算法设计,相比前代版本平均提升5%的词错误率(WER)。

模型特点

高效推理
通过CTranslate2引擎实现快速推理,适合实时语音识别应用
长文本优化
专门设计兼容OpenAI Whisper的长文本转录算法,处理长音频效果更佳
性能提升
相比distil-large-v2版本,在4个分布外数据集上平均提升5%的词错误率(WER)

模型能力

英语语音识别
长音频转录
实时语音转文字

使用案例

语音转录
会议记录
自动将会议录音转换为文字记录
准确率高,支持长时间录音
播客转录
将播客音频内容转换为可搜索的文字
处理长音频效果优异