U

Unispeech Sat Base Timit Ft

由 patrickvonplaten 开发
该模型是基于microsoft/unispeech-sat-base在TIMIT_ASR数据集上微调的自动语音识别模型,在评估集上取得了41.01%的词错误率。
下载量 15
发布时间 : 3/2/2022

模型简介

UniSpeech-SAT Base TIMIT微调版是一个专门针对英语语音识别任务优化的模型,通过在大规模语音数据上进行预训练并在TIMIT数据集上微调,实现了较高的语音识别准确率。

模型特点

TIMIT数据集微调
专门针对TIMIT ASR数据集进行优化,提高了在该数据集上的识别准确率
基于UniSpeech-SAT架构
采用微软UniSpeech-SAT基础架构,具备强大的语音特征提取能力
低词错误率
在评估集上实现了41.01%的词错误率,表现优于许多同类模型

模型能力

英语语音识别
连续语音转文本
音素级别识别

使用案例

语音转写
英语语音转录
将英语口语转换为书面文本
词错误率41.01%
语音学研究
音素分析
用于语音学研究和发音分析
AIbase
智启未来,您的人工智能解决方案智库
简体中文