W

Wav2vec2 Xls R 300m En Atc Atcosim

由 Jzuluaga 开发
该模型是基于facebook/wav2vec2-xls-r-300m在ATCOSIM语料库上微调的版本,专用于航空交通管制通信的自动语音识别任务。
下载量 104
发布时间 : 11/16/2022
模型介绍
内容详情
替代品

模型简介

一个针对航空交通管制(ATC)通信优化的自动语音识别(ASR)模型,在领域偏移场景下表现优异。

模型特点

领域适应性强
针对航空交通管制通信的特殊场景优化,在领域偏移情况下仍保持高性能
高效微调
仅需少量标注数据即可显著提升在ATC领域的识别准确率
噪声鲁棒性
在信噪比5-20dB的挑战性环境下仍能保持稳定表现

模型能力

航空管制语音识别
英语语音转文本
噪声环境语音处理

使用案例

航空交通管制
管制指令识别
将飞行员与管制员之间的语音通信转换为文本
相比传统方法降低20-40%词错误率
通信记录分析
自动转录ATC通信用于后续分析和存档
测试集词错误率7.36%