W

Wav2vec2 Large 960h Lv60 Self MIDIARIES 72H FT

由 caurdy 开发
基于Facebook预训练的wav2vec2 large 960H lv60自监督模型,使用72小时MI日记数据进行微调的语音识别模型
下载量 20
发布时间 : 4/21/2022
模型介绍
内容详情
替代品

模型简介

该模型是专门针对医疗访谈场景优化的语音识别模型,通过微调显著提升了在医疗对话场景下的识别准确率

模型特点

医疗场景优化
使用72小时医疗访谈数据进行微调,特别适合医疗对话场景
性能提升
在20分钟MI日记测试集上,词错误率从13%降至9.7%
基于成熟架构
基于Facebook预训练的wav2vec2 large 960H lv60自监督模型

模型能力

英语语音识别
医疗对话转录
自动语音转文本

使用案例

医疗健康
医疗访谈记录
自动转录医生与患者之间的对话
词错误率降低至9.7%
医疗文档生成
将医疗访谈录音自动转换为结构化文档