J

Ja Cascaded S2t Translation

由 japanese-asr 开发
这是一个基于级联方法的日语语音到任意目标语言文本的翻译流水线,由自动语音识别(ASR)和文本翻译两部分组成。
下载量 60
发布时间 : 9/25/2024

模型简介

该流水线使用 kotoba-tech/kotoba-whisper-v2.0 进行日语语音识别(日语语音 -> 日语文本),并使用 facebook/nllb-200-3.3B 进行文本翻译。输入必须是日语语音,而翻译可以是 NLLB 训练的任何语言。

模型特点

高准确率
在日语语音到英语文本的翻译任务中,相比OpenAI Whisper模型具有更低的词错误率(WER)。
多语言支持
支持将日语语音翻译为NLLB模型训练的任何目标语言。
模块化设计
采用级联方法,可以灵活替换ASR或翻译模块。
高效推理
即使在较长音频上也能保持较快的推理速度。

模型能力

日语语音识别
多语言文本翻译
音频处理

使用案例

语音翻译
日语会议记录翻译
将日语会议录音实时翻译为英语或其他语言文本。
在CoVoST2数据集上达到64.3 WER
日语教育
帮助日语学习者将日语语音转换为母语文本。
多语言内容创作
播客多语言字幕生成
将日语播客内容自动翻译为多种语言字幕。
AIbase
智启未来,您的人工智能解决方案智库
简体中文