W

Wav2vec2 Base Timit Ali Hasan Colab EX2

由 ali221000262 开发
基于facebook/wav2vec2-base微调的语音识别模型,在TIMIT数据集上训练,评估集WER为0.4458
下载量 23
发布时间 : 4/30/2022
模型介绍
内容详情
替代品

模型简介

该模型是基于wav2vec2架构的语音识别模型,适用于英语语音转文本任务

模型特点

高效微调
基于预训练的wav2vec2-base模型进行微调,提高了在特定任务上的表现
中等规模
采用base规模的wav2vec2架构,平衡了性能和计算资源需求

模型能力

英语语音识别
语音转文本

使用案例

语音转录
会议记录
将英语会议录音转换为文字记录
词错误率0.4458
语音笔记
将英语语音备忘录转换为文本