C

Canary 1b

由 nvidia 开发
Canary-1B是NVIDIA NeMo开发的多语言多任务模型,支持英语、德语、法语和西班牙语的自动语音识别和语音翻译任务。
下载量 7,734
发布时间 : 2/7/2024
模型介绍
内容详情
替代品

模型简介

Canary-1B是一个基于FastConformer和Transformer架构的编码器-解码器模型,专门设计用于高精度的自动语音识别(ASR)和语音到文本翻译(AST)任务。

模型特点

多语言支持
支持英语、德语、法语和西班牙语四种语言的语音识别和翻译
多任务能力
可同时执行自动语音识别和语音到文本翻译任务
高性能
在多个基准测试中达到最先进的性能水平
灵活配置
可选择是否包含标点和大小写(PnC)的输出

模型能力

英语语音识别
德语语音识别
法语语音识别
西班牙语语音识别
英语到德语翻译
英语到法语翻译
英语到西班牙语翻译
德语到英语翻译
法语到英语翻译
西班牙语到英语翻译

使用案例

语音转录
会议记录转录
将英语会议录音转换为文字记录
在LibriSpeech测试集上WER达到2.89
多语言字幕生成
为视频内容生成多种语言的字幕
实时翻译
跨语言会议翻译
实时将演讲者的语音翻译成其他语言文本
英德翻译BLEU值32.15,英法翻译BLEU值40.76