A

ASCEND Dataset Model

由 GleamEyeBeast 开发
基于facebook/wav2vec2-xls-r-300m微调的语音识别模型,在ASCEND数据集上训练
下载量 22
发布时间 : 3/14/2022

模型简介

该模型是用于自动语音识别(ASR)任务的微调模型,能够将语音转换为文本

模型特点

基于大规模预训练模型微调
基于facebook/wav2vec2-xls-r-300m预训练模型进行微调,具备强大的语音特征提取能力
优化后的识别性能
经过20轮训练后,在验证集上达到0.9540的词错误率(WER)
高效训练配置
采用混合精度训练和梯度累积等技术,优化训练效率

模型能力

语音转文本
自动语音识别
语音内容转录

使用案例

语音转录
会议记录自动生成
将会议录音自动转换为文字记录
准确率约95.4%
语音指令识别
识别用户语音指令并转换为可执行命令
AIbase
智启未来,您的人工智能解决方案智库
简体中文