U

Unispeech Large 1500h Cv Timit

由 patrickvonplaten 开发
该模型是基于microsoft/unispeech-large-1500h-cv在TIMIT_ASR数据集上微调得到的自动语音识别模型,在评估集上取得了21.96%的词错误率(WER)。
下载量 536
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

一个针对英语语音识别任务优化的自动语音识别模型,特别适用于TIMIT数据集类似的语音场景。

模型特点

基于大规模预训练模型微调
基于1500小时语音数据预训练的UniSpeech-Large模型进行微调,具有强大的语音特征提取能力
TIMIT数据集优化
专门针对TIMIT ASR数据集进行优化,在该数据集上表现优异
低词错误率
在评估集上取得了21.96%的词错误率(WER)

模型能力

英语语音识别
连续语音转文本
音素级别识别

使用案例

语音识别研究
TIMIT数据集语音识别基准测试
可用于语音识别算法的基准测试和比较
WER 21.96%
教育应用
英语发音评估
可用于英语学习者的发音准确度评估