t5_translate_en_ru_zh_base_200开源翻译模型 - 支持俄中英多语言双向翻译

首页

T5 Translate En Ru Zh Base 200

由 utrobinmv 开发

基于T5架构的多语言翻译模型，支持俄语、中文和英语之间的双向翻译

机器翻译

Transformers

支持多种语言开源协议:Apache-2.0 #多语言互译 #T5架构 #同步翻译

下载量 500

发布时间 : 1/7/2024

模型简介

该模型采用标准T5架构实现多任务翻译功能，专为俄汉互译、英汉互译、英俄互译优化，支持三种语言间的任意双向翻译。

模型特点

多语言支持

支持俄语、中文和英语三种语言之间的任意双向翻译

前缀指令翻译

通过在待翻译文本前添加目标语言前缀'translate to <语言代码>:'实现翻译控制

混合语言处理

源文本可包含多语言混合内容，模型能自动识别并翻译

模型能力

俄语到中文翻译

中文到俄语翻译

英语到俄语翻译

俄语到英语翻译

英语到中文翻译

中文到英语翻译

使用案例

语言服务

个人同步翻译

为用户提供个人同步翻译服务

开发的目的是为用户提供个人同步翻译

多语言文档翻译

商业文档和技术文档的多语言翻译

跨语言交流

实时聊天翻译

支持不同语言用户间的实时交流

🚀 T5英、俄、中文多语言机器翻译

本模型是一个处于多任务模式的传统T5变换器，用于翻译为所需语言，专门针对以下语言对进行机器翻译配置：俄 - 中、中 - 俄、英 - 中、中 - 英、英 - 俄、俄 - 英。该模型能够在俄语、中文和英语任意两种语言之间进行直接翻译。为了将文本翻译成目标语言，需要在文本前加上目标语言标识符前缀 'translate to :'。在这种情况下，无需指定源语言，此外，源文本可以是多语言的。

🚀 快速开始

俄语到中文翻译示例

from transformers import T5ForConditionalGeneration, T5Tokenizer

model_name = 'utrobinmv/t5_translate_en_ru_zh_small_1024'
model = T5ForConditionalGeneration.from_pretrained(model_name)
tokenizer = T5Tokenizer.from_pretrained(model_name)

prefix = 'translate to zh: '
src_text = prefix + "Цель разработки — предоставить пользователям личного синхронного переводчика."

# translate Russian to Chinese
input_ids = tokenizer(src_text, return_tensors="pt")

generated_tokens = model.generate(**input_ids)

result = tokenizer.batch_decode(generated_tokens, skip_special_tokens=True)
print(result)
#开发的目的是为用户提供个人同步翻译。

中文到俄语翻译示例

from transformers import T5ForConditionalGeneration, T5Tokenizer

model_name = 'utrobinmv/t5_translate_en_ru_zh_small_1024'
model = T5ForConditionalGeneration.from_pretrained(model_name)
tokenizer = T5Tokenizer.from_pretrained(model_name)

prefix = 'translate to ru: '
src_text = prefix + "开发的目的是为用户提供个人同步翻译。"

# translate Russian to Chinese
input_ids = tokenizer(src_text, return_tensors="pt")

generated_tokens = model.generate(**input_ids)

result = tokenizer.batch_decode(generated_tokens, skip_special_tokens=True)
print(result)
#Цель разработки - предоставить пользователям персональный синхронный перевод.

✨ 主要特性

支持多语言对翻译，包括俄 - 中、中 - 俄、英 - 中、中 - 英、英 - 俄、俄 - 英。
无需指定源语言，源文本可以是多语言的。

📚 详细文档

支持语言

属性	详情
支持语言	俄语 (ru_RU)、中文 (zh_CN)、英语 (en_US)

模型指标

utrobinmv/t5_translate_en_ru_zh_base_200 模型在英 - 俄翻译任务的指标

任务	数据集	指标类型	指标值	指标名称	是否验证	来源
翻译（英 - 俄）	ntrex_en-ru	sacrebleu	28.575940911021487	bleu	否	NTREX dataset Benchmark
翻译（英 - 俄）	ntrex_en-ru	chrf	54.27996346886896	chrf	否	NTREX dataset Benchmark
翻译（英 - 俄）	ntrex_en-ru	ter	62.494863914873584	ter	否	NTREX dataset Benchmark
翻译（英 - 俄）	ntrex_en-ru	meteor	0.5174833677740809	meteor	否	NTREX dataset Benchmark
翻译（英 - 俄）	ntrex_en-ru	rouge	0.1908317951570274	ROUGE - 1	否	NTREX dataset Benchmark
翻译（英 - 俄）	ntrex_en-ru	rouge	0.065555552204933	ROUGE - 2	否	NTREX dataset Benchmark
翻译（英 - 俄）	ntrex_en-ru	rouge	0.1895542893295215	ROUGE - L	否	NTREX dataset Benchmark
翻译（英 - 俄）	ntrex_en-ru	rouge	0.1893813749889601	ROUGE - LSUM	否	NTREX dataset Benchmark
翻译（英 - 俄）	ntrex_en-ru	bertscore	0.8554933660030365	bertscore_f1	否	NTREX dataset Benchmark
翻译（英 - 俄）	ntrex_en-ru	bertscore	0.8578473615646363	bertscore_precision	否	NTREX dataset Benchmark
翻译（英 - 俄）	ntrex_en-ru	bertscore	0.8534188346862793	bertscore_recall	否	NTREX dataset Benchmark

utrobinmv/t5_translate_en_ru_zh_base_200 模型在俄 - 英翻译任务的指标

任务	数据集	指标类型	指标值	指标名称	是否验证	来源
翻译（俄 - 英）	ntrex_ru-en	sacrebleu	28.575940911021487	bleu	否	NTREX dataset Benchmark
翻译（俄 - 英）	ntrex_ru-en	chrf	54.27996346886896	chrf	否	NTREX dataset Benchmark
翻译（俄 - 英）	ntrex_ru-en	ter	62.494863914873584	ter	否	NTREX dataset Benchmark
翻译（俄 - 英）	ntrex_ru-en	meteor	0.5174833677740809	meteor	否	NTREX dataset Benchmark
翻译（俄 - 英）	ntrex_ru-en	rouge	0.1908317951570274	ROUGE - 1	否	NTREX dataset Benchmark
翻译（俄 - 英）	ntrex_ru-en	rouge	0.065555552204933	ROUGE - 2	否	NTREX dataset Benchmark
翻译（俄 - 英）	ntrex_ru-en	rouge	0.1895542893295215	ROUGE - L	否	NTREX dataset Benchmark
翻译（俄 - 英）	ntrex_ru-en	rouge	0.1893813749889601	ROUGE - LSUM	否	NTREX dataset Benchmark
翻译（俄 - 英）	ntrex_ru-en	bertscore	0.8554933660030365	bertscore_f1	否	NTREX dataset Benchmark
翻译（俄 - 英）	ntrex_ru-en	bertscore	0.8578473615646363	bertscore_precision	否	NTREX dataset Benchmark
翻译（俄 - 英）	ntrex_ru-en	bertscore	0.8534188346862793	bertscore_recall	否	NTREX dataset Benchmark