W

Whisper Large V3 Distil Fr V0.2

由 bofenghuang 开发
专为法语语音转文本优化的Whisper蒸馏版本,仅保留2层解码器结构,在保证准确率的同时提升推理效率
下载量 385
发布时间 : 8/22/2024
模型介绍
内容详情
替代品

模型简介

基于OpenAI Whisper-large-v3的法语优化蒸馏模型,通过减少解码器层数和采用耐心教师蒸馏策略,实现高效语音识别

模型特点

高效推理
相比原模型提速5.8倍,参数量仅需49%,适合资源受限场景
长文本优化
训练采用30秒音频片段,增强长文本转录能力,减少幻觉输出
多框架兼容
支持transformers、faster-whisper、whisper.cpp等多种推理框架
推测解码支持
可作为草稿模型实现2倍加速,且保证输出与原模型一致

模型能力

法语语音转文本
长音频转录
实时语音识别
带噪语音处理

使用案例

客服场景
客服通话转录
处理含背景噪声和领域术语的客服录音
在内部测试集上表现良好
多媒体处理
法语视频字幕生成
为法语视频内容自动生成字幕