X

Xlsr Wav2vec English

由 harshit345 开发
基于facebook/wav2vec2-large在通用语音数据集上进行英语微调的自动语音识别模型,支持16kHz采样率的语音输入。
下载量 27
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个用于英语自动语音识别(ASR)的Wav2Vec2模型,经过微调后可直接使用,无需额外语言模型。

模型特点

高精度识别
在通用语音英语测试集上达到21.53%的词错误率和9.66%的字符错误率
无需语言模型
可直接使用,无需额外语言模型支持
16kHz采样率支持
专门针对16kHz采样率的语音输入进行优化

模型能力

英语语音识别
音频转录
自动语音转文本

使用案例

语音转录
会议记录
将会议录音自动转录为文字记录
播客转文字
将英语播客内容自动转换为文字稿
辅助技术
语音控制
为应用程序添加语音控制功能