W

Wav2vec2 Base Timit Demo Colab

由 Adil617 开发
该模型是基于facebook/wav2vec2-base微调的语音识别模型,适用于英语语音识别任务。
下载量 27
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

wav2vec2-base-timit-demo-colab是基于wav2vec2架构的语音识别模型,经过TIMIT数据集的微调,主要用于英语语音转文本任务。

模型特点

高效微调
基于预训练的wav2vec2-base模型进行微调,优化了在TIMIT数据集上的表现。
低词错误率
在评估集上取得了较低的词错误率(Wer)。
支持混合精度训练
训练过程中使用了原生AMP混合精度训练,提高了训练效率。

模型能力

英语语音识别
语音转文本

使用案例

语音识别
英语语音转录
将英语语音转换为文本,适用于语音助手、字幕生成等场景。
词错误率(Wer)为1.0