P

Parakeet Tdt Ctc 0.6b Ja

由 nvidia 开发
Parakeet TDT-CTC 0.6B是一个能够转录带标点符号的日语语音的自动语音识别(ASR)模型,由NVIDIA NeMo团队开发。
下载量 4,184
发布时间 : 5/13/2024
模型介绍
内容详情
替代品

模型简介

该模型是混合FastConformer TDT-CTC架构的XL版本,专门用于日语语音识别任务,能够处理带标点符号的语音转录。

模型特点

混合架构
结合FastConformer和TDT-CTC架构,优化了语音识别性能
高效推理
TDT架构通过解耦标记和持续时间预测,显著提高推理速度
日语支持
专门针对日语语音识别优化,支持带标点符号的转录
大规模训练
在超过35k小时的日语语音数据上训练

模型能力

日语语音识别
带标点符号转录
16kHz单声道音频处理

使用案例

语音转录
日语语音转文字
将日语语音内容转换为带标点符号的文本
在JSUT basic5000测试集上CER为6.4%
语音内容分析
对日语语音内容进行分析和处理