W

Whisper Large V3 French Distil Dec16

由 bofenghuang 开发
Whisper-Large-V3-法语蒸馏版是通过将解码器层数从32层缩减至16层,并基于大规模数据集进行蒸馏训练而得到的法语语音识别模型。该模型在保持性能的同时显著降低了内存占用和推理时间。
下载量 2,461
发布时间 : 12/13/2023
模型介绍
内容详情
替代品

模型简介

这是一个针对法语优化的语音识别模型,通过蒸馏技术减少了模型复杂度,适合需要高效语音转录的应用场景。

模型特点

高效蒸馏架构
解码器层数从32层缩减至16层,显著降低计算资源需求
性能保持
在保持接近原始模型准确率的同时提升推理速度
长文本处理优化
有效缓解了长文本转录中的幻觉风险
多框架支持
支持transformers、openai-whisper、fasterwhisper等多种推理框架

模型能力

法语语音识别
长音频转录
实时语音转文字

使用案例

客服场景
客服通话记录转录
将法语客服通话内容自动转录为文字
在包含背景噪声和领域术语的测试集上表现良好
媒体处理
法语视频字幕生成
自动为法语视频内容生成字幕