S

Stt Fr Conformer Ctc Large

由 nvidia 开发
这是一个基于Conformer架构的法语自动语音识别(ASR)大模型,采用CTC损失函数,在超过1500小时的法语语音数据上训练而成。
下载量 361
发布时间 : 6/28/2022
模型介绍
内容详情
替代品

模型简介

该模型用于法语语音识别任务,能够将法语语音转换为文本,支持16kHz单声道音频输入。

模型特点

高性能识别
在多个测试集上表现出色,如MCV7.0测试集WER仅9.63%,MLS测试集WER仅4.91%
大规模训练数据
在超过1500小时的法语语音数据上训练,涵盖多个领域
Riva兼容
支持通过NVIDIA Riva进行生产级服务器部署
非自回归架构
采用Conformer-CTC架构,实现高效推理

模型能力

法语语音识别
音频转录
批量语音处理

使用案例

语音转录
法语语音转文字
将法语语音内容转换为文本
高准确率的转录结果
语音助手
法语语音交互
为法语语音助手提供语音识别能力