W

Wav2vec2 Bert CV16 En

由 hf-audio 开发
基于w2v-bert-2.0在Common Voice 16.0英文数据集上微调的自动语音识别(ASR)模型
下载量 1,700
发布时间 : 1/5/2024
模型介绍
内容详情
替代品

模型简介

该模型是用于英语语音识别的自动语音识别系统,在Common Voice 16.0英文数据集上进行了微调,能够将英语语音转换为文本

模型特点

高效语音识别
在Common Voice 16.0英文数据集上微调,具有较高的识别准确率
低词错误率
在评估集上取得14.55%的词错误率(WER)和5.8%的字符错误率(CER)
多GPU训练优化
支持多GPU分布式训练,采用Adam优化器和线性学习率调度

模型能力

英语语音识别
语音转文本
自动语音转录

使用案例

语音转录
语音备忘录转录
将英语语音备忘录自动转换为文本
准确率约85.45%(1-WER)
会议记录自动化
自动生成英语会议的文本记录
辅助技术
实时字幕生成
为英语视频内容生成实时字幕