E

Elan Mt Bt Ja En

由 Mitsua 开发
ElanMT-BT-ja-en是由ELAN MITSUA项目/Abstract Engine开发的日语到英语翻译模型,仅使用开放许可数据和反向翻译的维基百科数据进行训练。
下载量 502
发布时间 : 5/20/2024
模型介绍
内容详情
替代品

模型简介

该模型是基于Marian MT架构的日语到英语翻译模型,专注于使用开放许可数据进行训练,避免了网络爬取或其他机器翻译语料库的使用。

模型特点

开放数据训练
仅使用CC0、CC BY和CC BY-SA等开放许可的语料库进行训练,避免了版权问题。
反向翻译增强
通过反向翻译模型增强训练数据,提高了翻译质量。
高质量词汇表现
新构建的150万行维基百科平行语料库显著提升了词汇层面的表现。

模型能力

日语到英语的文本翻译
多句文本处理

使用案例

文本翻译
日语到英语的文档翻译
将日语文档翻译成英语,适用于开放许可内容的翻译需求。
在FLORES+和NTREX数据集上表现良好,BLEU分数达到24.87和22.57。