W

Whisper Large Zh Cv11

由 jonatasgrosman 开发
基于openai/whisper-large-v2在中文(普通话)上使用Common Voice 11数据集微调的语音识别模型
下载量 145
发布时间 : 12/18/2022

模型简介

该模型是针对中文(普通话)优化的自动语音识别(ASR)模型,在Common Voice 11数据集上进行了微调,显著提升了中文语音识别准确率。

模型特点

中文优化
针对中文普通话进行了专门微调,显著提升了中文语音识别准确率
多场景评估
在Common Voice和Fleurs两个数据集上进行了全面评估,包含原始文本和标准化文本两种场景
标点支持
能够识别并转录语音中的标点符号

模型能力

普通话语音识别
标点符号识别
大小写转换

使用案例

语音转写
会议记录
将中文会议录音自动转写为文字记录
在Common Voice测试集上CER为9.55%,WER为55.02%
语音笔记
将个人语音备忘录转换为文字
语音助手
中文语音指令识别
用于智能家居或移动设备的中文语音指令识别
AIbase
智启未来,您的人工智能解决方案智库
简体中文