C

Canary 1b Flash

由 nvidia 开发
NVIDIA NeMo Canary Flash 是一个多语言多任务模型家族,在多个语音基准测试中实现了最先进的性能。支持四种语言的自动语音识别和翻译任务。
下载量 125.22k
发布时间 : 3/7/2025
模型介绍
内容详情
替代品

模型简介

Canary 1B Flash 是基于Canary架构的多语言多任务模型,支持英语、德语、法语、西班牙语的自动语音转文本识别(ASR),以及这些语言之间的互译。模型还提供实验性的时间戳功能。

模型特点

多语言支持
支持英语、德语、法语、西班牙语四种语言的语音识别和翻译
多任务能力
同时支持自动语音识别和语音翻译任务
时间戳功能
提供实验性的单词级和片段级时间戳功能
高效推理
在open-asr-leaderboard数据集上实现超过1000 RTFx的推理速度

模型能力

英语语音识别
德语语音识别
法语语音识别
西班牙语语音识别
英德翻译
英法翻译
英西翻译
德英翻译
法英翻译
西英翻译
生成时间戳

使用案例

语音转录
会议记录
将会议录音自动转录为文字
支持四种语言的准确转录
字幕生成
为视频内容生成字幕
可生成带时间戳的字幕
语音翻译
实时翻译
将一种语言的语音实时翻译为另一种语言的文本
支持四种语言间的互译