U

Unispeech Sat Base Plus Timit Ft

由 patrickvonplaten 开发
基于microsoft/unispeech-sat-base-plus在TIMIT_ASR数据集上微调的自动语音识别(ASR)模型
下载量 16
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是针对英语语音识别任务优化的神经网络模型,特别适用于学术研究和语音识别系统开发

模型特点

TIMIT数据集微调
专门在标准TIMIT语音识别数据集上进行微调,优化了英语语音识别性能
基于UniSpeech-SAT架构
采用微软UniSpeech-SAT基础模型,结合自注意力机制进行语音特征提取
逐步优化训练
通过20轮训练逐步降低词错误率(WER),最终达到0.4051的识别准确率

模型能力

英语语音识别
连续语音转文本
语音特征提取

使用案例

学术研究
语音识别基准测试
可作为TIMIT数据集上的基准模型进行比较研究
词错误率0.4051
语音技术开发
语音转文本系统
用于开发英语语音识别应用