W

Whisper Large V3.w4a16

由 nm-testing 开发
这是openai/whisper-large-v3的量化版本,采用INT4权重量化和FP16激活量化,适用于vLLM推理。
下载量 20
发布时间 : 2/14/2025
模型介绍
内容详情
替代品

模型简介

该模型是Whisper-large-v3的量化版本,主要用于语音识别任务,将音频转换为文本。

模型特点

高效量化
采用INT4权重量化和FP16激活量化,显著减少模型大小和内存占用
vLLM兼容
专为vLLM >= 0.5.2优化,可实现高效推理
保持高精度
在量化后仍保持接近原始模型的识别准确率

模型能力

语音识别
音频转文本
英语转录

使用案例

语音转录
会议记录
将会议录音自动转换为文字记录
WER(词错误率)约12.95%
播客转录
将播客音频内容转换为可搜索的文本