这是一个基于级联方法的日语语音到任意目标语言文本的翻译流水线,由自动语音识别(ASR)和文本翻译两部分组成。
下载量 60
发布时间 : 9/25/2024
模型简介
该流水线使用 kotoba-tech/kotoba-whisper-v2.0 进行日语语音识别(日语语音 -> 日语文本),并使用 facebook/nllb-200-3.3B 进行文本翻译。输入必须是日语语音,而翻译可以是 NLLB 训练的任何语言。
模型特点
高准确率
在日语语音到英语文本的翻译任务中,相比OpenAI Whisper模型具有更低的词错误率(WER)。
多语言支持
支持将日语语音翻译为NLLB模型训练的任何目标语言。
模块化设计
采用级联方法,可以灵活替换ASR或翻译模块。
高效推理
即使在较长音频上也能保持较快的推理速度。
模型能力
日语语音识别
多语言文本翻译
音频处理
使用案例
语音翻译
日语会议记录翻译
将日语会议录音实时翻译为英语或其他语言文本。
在CoVoST2数据集上达到64.3 WER
日语教育
帮助日语学习者将日语语音转换为母语文本。
多语言内容创作
播客多语言字幕生成
将日语播客内容自动翻译为多种语言字幕。
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文