D

Distil Whisper Small Cantonese

由 alvanlii 开发
这是一个基于Whisper Small的粤语语音识别蒸馏模型,在Common Voice 16.0上实现了9.7的CER(无标点符号)。
下载量 187
发布时间 : 4/3/2024
模型介绍
内容详情
替代品

模型简介

该模型是Whisper Small的蒸馏版本,专门针对粤语语音识别任务进行了优化,具有更小的模型尺寸和更快的推理速度。

模型特点

高效推理
相比原版Whisper Small模型,推理速度提升约50%,GPU VRAM需求仅约2GB
粤语优化
专门针对粤语语音识别任务进行了训练和优化
轻量级
通过减少解码器层数实现了模型压缩,参数量从242M减少到157M

模型能力

粤语语音识别
语音转文字
音频转录

使用案例

语音转录
粤语会议记录
将粤语会议录音自动转录为文字
在Common Voice 16.0测试集上达到9.7%的字符错误率(CER)
媒体字幕生成
为粤语视频内容自动生成字幕