W

Wav2vec2 Base Checkpoint 9

由 jiobiala24 开发
该模型是基于wav2vec2-base-checkpoint-8在common_voice数据集上微调的语音识别模型,在评估集上取得了0.3258的词错误率。
下载量 16
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个基于wav2vec2架构的语音识别模型,经过在common_voice数据集上的微调,能够将语音转换为文本。

模型特点

低词错误率
在评估集上取得了0.3258的词错误率,表现良好。
基于wav2vec2架构
采用先进的wav2vec2架构,能够有效学习语音特征。
在common_voice数据集上微调
使用common_voice数据集进行微调,提高了模型的泛化能力。

模型能力

语音识别
自动语音转文本

使用案例

语音转录
语音备忘录转录
将语音备忘录自动转换为文本
准确率约67.42%(基于词错误率推算)
无障碍应用
实时字幕生成
为听力障碍人士提供实时字幕