A

Ascend With Timit

由 GleamEyeBeast 开发
该模型是基于TIMIT数据集微调的语音识别模型,在评估集上取得了0.4781的词错误率和0.1727的字符错误率。
下载量 16
发布时间 : 4/4/2022
模型介绍
内容详情
替代品

模型简介

这是一个自动语音识别(ASR)模型,主要用于将语音转换为文本。模型在TIMIT数据集上进行了微调,适用于英语语音识别任务。

模型特点

低词错误率
在评估集上取得了0.4781的词错误率,表现良好
低字符错误率
在评估集上取得了0.1727的字符错误率,准确性高
高效训练
使用混合精度训练(原生AMP)优化训练效率

模型能力

英语语音识别
语音转文本

使用案例

语音转录
会议记录
将会议录音自动转换为文字记录
准确率约52.19%(基于1-WER计算)
字幕生成
为视频内容自动生成英文字幕
字符级准确率约82.73%