W

Wav2vec2 Base Checkpoint 5

由 jiobiala24 开发
该模型是基于wav2vec2-base-checkpoint-4在common_voice数据集上微调的语音识别模型,支持自动语音识别(ASR)任务。
下载量 16
发布时间 : 3/2/2022

模型简介

基于wav2vec2架构的语音识别模型,在common_voice数据集上微调,用于将语音转换为文本。

模型特点

高效微调
基于预训练的wav2vec2模型进行微调,提高了在common_voice数据集上的识别准确率
低词错误率
在评估集上取得了0.3354的词错误率(WER),表现良好
优化训练
采用线性学习率调度和Adam优化器进行30轮训练,确保模型收敛

模型能力

语音识别
音频转文本

使用案例

语音转录
语音转文字服务
将语音内容自动转换为文字记录
词错误率0.3354
辅助工具
听障辅助
实时将语音转换为文字,帮助听障人士理解语音内容
AIbase
智启未来,您的人工智能解决方案智库
简体中文