K

Kotoba Whisper Bilingual V1.0

由 kotoba-tech 开发
Kotoba-Whisper-Bilingual是通过蒸馏Whisper模型训练而成的集合,专为日语和英语语音识别及语音到文本翻译任务设计。
下载量 782
发布时间 : 9/27/2024
模型介绍
内容详情
替代品

模型简介

该模型支持日语和英语的自动语音识别(ASR)以及日语和英语之间的语音到文本翻译任务。

模型特点

双语支持
同时支持日语和英语的语音识别及互译
高效推理
比原始Whisper large-v3模型快6.3倍
多任务能力
可同时执行语音识别和语音到文本翻译任务

模型能力

日语语音识别
英语语音识别
日语到英语语音翻译
英语到日语语音翻译

使用案例

语音识别
日语语音转录
将日语语音转换为文本
在CommonVoice 8日语测试集上CER为9.8
英语语音转录
将英语语音转换为文本
在ESB数据集上表现良好
语音翻译
日语到英语翻译
将日语语音实时翻译为英语文本
在CoVoST2(Ja->En)上WER为73.9
英语到日语翻译
将英语语音实时翻译为日语文本
在CoVoST2(En->Ja)上CER为69.1