W

Wav2vec2 Xls R 300m Zh CN

由 anantoj 开发
该模型是基于facebook/wav2vec2-xls-r-300m在通用语音数据集ZH-CN上微调的自动语音识别(ASR)模型,支持中文普通话识别。
下载量 37
发布时间 : 3/2/2022

模型简介

这是一个针对中文普通话优化的自动语音识别模型,在通用语音数据集上进行了微调,能够将语音转换为文本。

模型特点

中文优化
专门针对中文普通话进行了微调,在中文语音识别任务上表现良好
基于大模型
基于300M参数的wav2vec2-xls-r大模型,具有较强的语音特征提取能力
通用语音数据集
使用通用语音数据集(Common Voice)进行训练,具有较好的泛化能力

模型能力

中文语音识别
语音转文本
自动语音转录

使用案例

语音转录
会议记录
将会议录音自动转换为文字记录
CER(字错误率)约20.59%
语音输入
为应用程序提供语音输入功能
无障碍技术
实时字幕
为听力障碍人士提供实时语音转文字服务
AIbase
智启未来,您的人工智能解决方案智库
简体中文