S

Stt Fr Fastconformer Hybrid Large Pc

由 nvidia 开发
这是一个法语自动语音识别模型,基于FastConformer架构,结合了Transducer和CTC解码器,具有高准确率和多领域适应性。
下载量 1,331
发布时间 : 5/23/2023

模型简介

该模型能够转录包含大小写法语字母、空格、句号、逗号和问号的语音。是FastConformer Transducer-CTC模型的'大型'版本,约1.15亿参数。

模型特点

混合训练
结合Transducer和CTC两种损失函数进行训练,提高模型鲁棒性
优化架构
采用FastConformer架构,具有8倍深度可分离卷积下采样,效率更高
多数据集训练
在1800小时法语语音数据上训练,包括MCV12、MLS和Voxpopuli数据集
标点支持
支持转录包含句号、逗号和问号的文本

模型能力

法语语音识别
标点符号识别
大小写识别
长音频处理

使用案例

语音转录
会议记录
将法语会议录音转换为文字记录
WER 7.92 (MCV12测试集)
音频字幕
为法语视频内容生成字幕
WER 5.21 (MLS测试集)
语音分析
语音数据分析
分析法语语音数据中的关键词和内容
WER 6.49 (VoxPopuli测试集)
AIbase
智启未来,您的人工智能解决方案智库
简体中文