W

Wav2vec2 Base Toy Train Data Augment 0.1

由 scasutt 开发
基于facebook/wav2vec2-base微调的语音识别模型,在玩具数据集上训练并应用了0.1比例的数据增强
下载量 22
发布时间 : 3/25/2022
模型介绍
内容详情
替代品

模型简介

该模型是wav2vec2-base的微调版本,主要用于语音识别任务,但当前性能表现欠佳(WER高达0.9954)

模型特点

数据增强训练
训练过程中应用了0.1比例的数据增强技术
基于wav2vec2架构
采用facebook的wav2vec2-base作为基础模型

模型能力

语音识别
音频特征提取

使用案例

语音处理
语音转文字
将语音内容转换为文本
当前词错误率较高(WER=0.9954)