W

Wav2vec2 Base Toy Train Data Augmented

由 scasutt 开发
基于facebook/wav2vec2-base模型微调的语音识别模型,在增强训练数据上进行了优化。
下载量 22
发布时间 : 3/26/2022

模型简介

该模型是一个语音识别模型,基于wav2vec2架构,通过微调在特定数据集上提升了识别准确率。

模型特点

数据增强训练
模型在训练过程中使用了数据增强技术,提升了泛化能力。
低词错误率
经过微调后,模型在验证集上取得了较低的词错误率(Wer)。

模型能力

语音识别
音频转文本

使用案例

语音转写
会议记录转写
将会议录音自动转写为文本,便于记录和检索。
语音助手
用于语音助手中的语音识别模块,提升识别准确率。
AIbase
智启未来,您的人工智能解决方案智库
简体中文