W

Wav2vec2 Large 100h Lv60 Self

由 Splend1dchan 开发
Wav2Vec2-Large-100h-Lv60是基于100小时Libri-Light和Librispeech语音数据预训练和微调的大模型,采用自训练目标训练,适用于16kHz采样率的语音识别任务。
下载量 17
发布时间 : 4/12/2022
模型介绍
内容详情
替代品

模型简介

该模型是一个自动语音识别(ASR)模型,通过自监督学习从原始音频中学习语音表征,并在有限标注数据下实现高性能语音识别。

模型特点

自监督学习
采用自训练目标进行训练,能够在有限标注数据下学习有效的语音表征
高效语音识别
在Librispeech数据集上实现了较低的词错误率(WER)
低资源适应
即使在仅有10分钟标注数据的情况下,也能实现可接受的识别效果

模型能力

语音识别
音频特征提取
英语语音转录

使用案例

语音转文字
会议记录
将英语会议录音自动转录为文字记录
播客转录
将英语播客内容自动转换为文字稿
语音助手
语音命令识别
识别和理解英语语音命令