W

Wav2vec2 Large Chinese Zh Cn

由 wbbbbb 开发
基于XLSR-53大模型微调的中文语音识别模型,支持16kHz采样率的语音输入
下载量 585
发布时间 : 7/18/2022
模型介绍
内容详情
替代品

模型简介

该模型是针对中文语音识别任务微调的XLSR-53大模型,在Common Voice等中文语音数据集上训练,可直接用于语音转文字任务

模型特点

中文语音识别优化
专门针对中文语音特点进行微调,在中文语音识别任务上表现优于通用模型
多数据集训练
使用Common Voice 6.1、CSS10和ST-CMDS等多个中文语音数据集进行训练
无需语言模型
可直接使用,无需额外语言模型支持

模型能力

中文语音识别
语音转文字
16kHz音频处理

使用案例

语音转写
会议记录自动转写
将中文会议录音自动转换为文字记录
语音笔记转换
将个人语音备忘录转换为可搜索的文本
无障碍应用
实时字幕生成
为听力障碍用户提供实时语音转文字服务