wav2vec2-large-960h-lv60-self_MIDIARIES_72H_FT开源语音识别模型

首页

Wav2vec2 Large 960h Lv60 Self MIDIARIES 72H FT

由 caurdy 开发

基于Facebook预训练的wav2vec2 large 960H lv60自监督模型，使用72小时MI日记数据进行微调的语音识别模型

语音识别

Transformers

#语音识别优化 #医学日记转录 #微调降错率

下载量 20

发布时间 : 4/21/2022

模型简介

该模型是专门针对医疗访谈场景优化的语音识别模型，通过微调显著提升了在医疗对话场景下的识别准确率

模型特点

医疗场景优化

使用72小时医疗访谈数据进行微调，特别适合医疗对话场景

性能提升

在20分钟MI日记测试集上，词错误率从13%降至9.7%

基于成熟架构

基于Facebook预训练的wav2vec2 large 960H lv60自监督模型

模型能力

英语语音识别

医疗对话转录

自动语音转文本

使用案例

医疗健康

医疗访谈记录

自动转录医生与患者之间的对话

词错误率降低至9.7%

医疗文档生成

将医疗访谈录音自动转换为结构化文档

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文

Wav2vec2 Large 960h Lv60 Self MIDIARIES 72H FT

模型简介

模型特点

模型能力

使用案例

🚀 微调版wav2vec2大模型

🚀 快速开始

模型使用

📄 许可证