W

Wav2vec2 Large Xlsr 53 Chinese Zn Cn Aishell1

由 qinyue 开发
基于facebook/wav2vec2-large-xlsr-53在中文AISHELL-1数据集上微调的语音识别模型,支持中文语音识别任务。
下载量 22
发布时间 : 6/16/2022
模型介绍
内容详情
替代品

模型简介

该模型是一个自动语音识别(ASR)模型,专门针对中文语音进行优化,能够将中文语音转换为文本。

模型特点

中文语音识别
专门针对中文语音优化的识别模型,在AISHELL-1数据集上表现优异。
无需语言模型
可以直接使用,不需要额外的语言模型支持。
高准确率
在AISHELL-1测试集上达到7.04%的词错误率(WER),使用语言模型后可降至3.96%。

模型能力

中文语音识别
16kHz采样率音频处理

使用案例

语音转写
会议记录
将会议录音自动转换为文字记录
准确率高达92.96%(WER 7.04%)
语音助手
用于中文语音助手的人机交互
语音分析
语音内容分析
分析语音内容中的关键词和主题