W

Whisper Small Cantonese

由 alvanlii 开发
基于OpenAI Whisper-small微调的粤语语音识别模型,在Common Voice 16.0测试集上CER为7.93
下载量 2,413
发布时间 : 12/8/2022
模型介绍
内容详情
替代品

模型简介

专为粤语优化的自动语音识别模型,支持高效准确的粤语语音转文字

模型特点

优化的粤语识别
针对粤语特点进行专门微调,字符错误率(CER)低至7.93
高效推理
支持Flash Attention加速,单样本处理仅需0.055秒
多格式支持
提供GGML和CT2格式,兼容Whisper.cpp和WhisperX等工具
推测性解码支持
可作为辅助模型加速大模型的推理过程

模型能力

粤语语音识别
中文语音识别
快速语音转文字
长音频处理(支持分块)

使用案例

语音转录
粤语视频字幕生成
为粤语视频内容自动生成准确的字幕
CER 7.93的识别准确率
语音助手
构建支持粤语的语音交互应用
快速响应(0.055秒/样本)
语音分析
粤语语音数据分析
对粤语语音内容进行转写和分析
支持多种粤语数据集格式