M

Mandarin

由 GleamEyeBeast 开发
这是一个基于wav2vec2-large-xlsr-53模型在common_voice数据集上微调的普通话语音识别模型
下载量 25
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型主要用于普通话语音识别任务,基于Facebook的wav2vec2架构进行微调

模型特点

基于wav2vec2架构
采用Facebook的wav2vec2-large-xlsr-53架构,具有良好的语音识别基础
普通话优化
专门针对普通话语音特点进行微调
开源许可
使用Apache 2.0许可证,允许商业和研究使用

模型能力

普通话语音识别
音频转文本

使用案例

语音转写
普通话语音转文字
将普通话语音内容转换为文本
语音助手
普通话语音交互
可用于构建普通话语音助手