W

Wav2vec2 Base Cynthia Tedlium 2500 V2

由 huyue012 开发
该模型是基于facebook/wav2vec2-base-960h在TED-LIUM数据集上微调的语音识别模型,在评估集上达到20.33%的词错误率。
下载量 25
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

一个针对英语语音识别任务优化的wav2vec2模型,适用于语音转文本应用场景。

模型特点

低词错误率
在TED-LIUM评估集上达到20.33%的词错误率,表现优异
基于wav2vec2架构
采用经过验证的wav2vec2-base-960h作为基础模型
精细调优
经过50轮训练和3500步的精细调优过程

模型能力

英语语音识别
音频转文本
连续语音识别

使用案例

教育
讲座转录
将TED演讲等教育内容自动转录为文字
准确率约80%
会议记录
会议记录自动化
自动记录会议内容并生成文字记录