C

Canary 180m Flash

由 nvidia 开发
NVIDIA NeMo Canary Flash 是一个多语言多任务语音模型,支持英语、德语、法语和西班牙语的自动语音识别和翻译任务。
下载量 15.17k
发布时间 : 3/11/2025
模型介绍
内容详情
替代品

模型简介

Canary 180M Flash 是基于Canary架构的多语言多任务模型,在多个语音基准测试中实现了最先进的性能。支持4种语言的自动语音到文本识别(ASR),以及多种语言间的翻译功能。

模型特点

多语言支持
支持英语、德语、法语和西班牙语四种语言的语音识别和翻译
多任务处理
能够同时处理自动语音识别和自动语音翻译任务
时间戳功能
提供单词级和片段级时间戳实验功能
高效推理
超过1200 RTFx的推理速度,适合实时应用

模型能力

语音识别
语音翻译
时间戳生成
多语言处理

使用案例

语音转录
会议记录
将会议录音自动转录为文字
支持多种语言的准确转录
字幕生成
为视频内容自动生成字幕
可生成带时间戳的字幕
语音翻译
实时翻译
将一种语言的语音实时翻译为另一种语言的文字
支持多种语言间的互译