S

Stt De Fastconformer Hybrid Large Pc

由 nvidia 开发
这是一个基于FastConformer架构的德语自动语音识别模型,采用转换器和CTC混合训练方式,参数规模约115M。
下载量 1,017
发布时间 : 5/4/2023
模型介绍
内容详情
替代品

模型简介

该模型用于德语语音转录,支持大小写字母、空格及基本标点符号的识别。是NVIDIA NeMo工具包中的预训练模型。

模型特点

混合训练架构
同时使用转换器和CTC解码器进行训练,结合两种损失函数的优势
优化的FastConformer
采用8倍深度可分离卷积下采样,相比标准Conformer模型更高效
多数据集训练
在2500小时的复合德语数据集上训练,包含MCV12、MLS和Voxpopuli
标点符号支持
能够识别句号、逗号和问号等基本标点符号

模型能力

德语语音识别
标点符号识别
大小写字母识别

使用案例

语音转录
语音转文字
将德语语音内容转换为文本
在MCV12测试集上WER为5.1%
会议记录
自动生成会议语音的文字记录
语音分析
语音内容分析
为后续的语音内容分析提供文本基础