B

Belle Whisper Large V3 Turbo Zh

由 BELLE-2 开发
基于whisper-large-v3-turbo微调的中文语音识别模型,在多个中文语音识别基准测试中性能提升显著
下载量 2,891
发布时间 : 10/14/2024
模型介绍
内容详情
替代品

模型简介

本模型通过对whisper-large-v3-turbo进行中文语音识别能力的微调,在多个中文语音识别基准测试中相比原版实现了24-64%的相对性能提升。

模型特点

中文语音识别性能提升
在AISHELL1、AISHELL2、WENETSPEECH和HKUST等中文语音识别基准测试中,相比原版whisper-large-v3-turbo实现了24-64%的相对性能提升
标点符号预测集成
标点符号预测功能集成自punc_ct-transformer_cn-en-common-vocab471067-large模型
全参数微调
使用AISHELL-1、AISHELL-2、WenetSpeech和HKUST数据集进行全参数微调

模型能力

中文语音识别
标点符号预测

使用案例

语音转写
会议记录转写
将中文会议录音转换为带标点的文字记录
在wenetspeech会议语料上字错误率13.357%
电话录音转写
将中文电话录音转换为文字
在HKUST开发集上字错误率18.944%