W

Wav2vec2 Base Toy Train Data Random Noise

由 scasutt 开发
该模型是基于facebook/wav2vec2-base在玩具训练数据上微调的语音识别模型,主要用于处理随机噪声环境下的语音识别任务。
下载量 22
发布时间 : 3/27/2022
模型介绍
内容详情
替代品

模型简介

这是一个经过微调的wav2vec2-base模型,专门用于在随机噪声环境下进行语音识别。模型在评估集上取得了0.7351的词错误率。

模型特点

噪声环境适应
针对随机噪声环境进行了优化,提高了在嘈杂条件下的语音识别准确率
基于wav2vec2架构
建立在强大的wav2vec2-base模型基础上,继承了其优秀的语音特征提取能力

模型能力

语音识别
噪声环境下的语音处理

使用案例

语音转录
嘈杂环境下的语音转录
将包含随机噪声的语音转换为文字
词错误率0.7351