W

Whisper Large Onnx Int4 Inc

由 Intel 开发
Whisper是一种预训练模型,用于自动语音识别(ASR)和语音翻译。本仓库提供ONNX格式的Whisper大型模型INT4权重量化版本,由英特尔®神经压缩器和英特尔®Transformers扩展驱动。
下载量 44
发布时间 : 10/8/2023
模型介绍
内容详情
替代品

模型简介

Whisper是一种预训练模型,经过68万小时标注数据训练后,展现出强大的泛化能力,无需微调即可适应多种数据集和领域。本模型为INT4量化版本,适用于自动语音识别推理。

模型特点

INT4量化
模型经过INT4权重量化,显著减小模型大小(从8.8GB降至1.9GB),同时保持高性能。
ONNX格式
模型以ONNX格式提供,便于在不同平台上部署和推理。
高性能
量化后的模型在librispeech_asr数据集上词错误率仅3.05%,与FP32版本(3.04%)几乎相同。
无需微调
模型展现出强大的泛化能力,无需微调即可适应多种数据集和领域。

模型能力

自动语音识别
语音翻译

使用案例

语音识别
语音转文字
将语音内容转换为文字,适用于会议记录、字幕生成等场景。
词错误率3.05%