Whisper Large Zh Cv11
基于openai/whisper-large-v2在中文(普通话)上使用Common Voice 11数据集微调的语音识别模型
下载量 145
发布时间 : 12/18/2022
模型简介
该模型是针对中文(普通话)优化的自动语音识别(ASR)模型,在Common Voice 11数据集上进行了微调,显著提升了中文语音识别准确率。
模型特点
中文优化
针对中文普通话进行了专门微调,显著提升了中文语音识别准确率
多场景评估
在Common Voice和Fleurs两个数据集上进行了全面评估,包含原始文本和标准化文本两种场景
标点支持
能够识别并转录语音中的标点符号
模型能力
普通话语音识别
标点符号识别
大小写转换
使用案例
语音转写
会议记录
将中文会议录音自动转写为文字记录
在Common Voice测试集上CER为9.55%,WER为55.02%
语音笔记
将个人语音备忘录转换为文字
语音助手
中文语音指令识别
用于智能家居或移动设备的中文语音指令识别
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers 支持多种语言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers 英语

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统 中文
R
uer
2,694
98
智启未来,您的人工智能解决方案智库
简体中文