t5_translate_en_ru_zh_small_1024开源翻译模型 - 免费实现英俄中三语双向互译

首页

T5 Translate En Ru Zh Small 1024

由 utrobinmv 开发

基于T5架构的多语言翻译模型，支持俄语、中文和英语之间的双向互译

机器翻译

Transformers

支持多种语言开源协议:Apache-2.0 #多语言互译 #T5架构优化 #混合文本翻译

下载量 2,405

发布时间 : 1/7/2024

模型简介

采用T5转换器架构的多任务翻译模型，专为俄语、中文和英语之间的机器翻译优化配置，支持六种语言对的互译任务

模型特点

多语言互译

支持俄语、中文和英语三种语言之间的任意双向互译

多任务处理

单一模型处理六种语言对翻译任务，无需切换不同模型

混合内容处理

源文本可包含多语言混合内容，模型能自动识别源语言

模型能力

俄语到中文翻译

中文到俄语翻译

英语到中文翻译

中文到英语翻译

英语到俄语翻译

俄语到英语翻译

使用案例

语言服务

个人同步翻译

为用户提供个性化的同步翻译服务

准确翻译技术文档和日常用语

跨语言交流

多语言内容本地化

帮助企业和个人实现内容的多语言转换

保持原文语义的同时实现自然流畅的翻译

🚀 T5英俄中多语言机器翻译

本模型是一个处于多任务模式下的传统T5变压器模型，用于将文本翻译为所需语言。它经过精确配置，可处理以下语言对的机器翻译：俄-中、中-俄、英-中、中-英、英-俄、俄-英。该模型能够直接在俄语、中文和英语这三种语言的任意组合之间进行翻译。在进行目标语言翻译时，需将目标语言标识符作为前缀 “translate to :” 指定。此时，源语言可以不指定，而且源文本可以是多语言的。

🚀 快速开始

安装依赖

要使用这个模型，你需要安装transformers库。可以使用以下命令进行安装：

pip install transformers

代码示例

从俄语翻译成中文

from transformers import T5ForConditionalGeneration, T5Tokenizer

device = 'cuda' # 或者使用 'cpu' 在CPU上进行翻译

model_name = 'utrobinmv/t5_translate_en_ru_zh_small_1024'
model = T5ForConditionalGeneration.from_pretrained(model_name)
model.to(device)
tokenizer = T5Tokenizer.from_pretrained(model_name)

prefix = 'translate to zh: '
src_text = prefix + "Цель разработки — предоставить пользователям личного синхронного переводчика."

# 从俄语翻译成中文
input_ids = tokenizer(src_text, return_tensors="pt")

generated_tokens = model.generate(**input_ids.to(device))

result = tokenizer.batch_decode(generated_tokens, skip_special_tokens=True)
print(result)
# 开发的目的就是向用户提供个性化的同步翻译。

从中文翻译成俄语

from transformers import T5ForConditionalGeneration, T5Tokenizer

device = 'cuda' # 或者使用 'cpu' 在CPU上进行翻译

model_name = 'utrobinmv/t5_translate_en_ru_zh_small_1024'
model = T5ForConditionalGeneration.from_pretrained(model_name)
model.to(device)
tokenizer = T5Tokenizer.from_pretrained(model_name)

prefix = 'translate to ru: '
src_text = prefix + "开发的目的就是向用户提供个性化的同步翻译。"

# 从俄语翻译成中文
input_ids = tokenizer(src_text, return_tensors="pt")

generated_tokens = model.generate(**input_ids.to(device))

result = tokenizer.batch_decode(generated_tokens, skip_special_tokens=True)
print(result)
# Цель разработки - предоставить персонализированный синхронный перевод для пользователей.

✨ 主要特性

多语言支持：该模型支持俄语（ru_RU）、中文（zh_CN）和英语（en_US）之间的直接翻译。
灵活翻译：在翻译时，无需指定源语言，源文本也可以是多语言的。只需在源文本前加上目标语言标识符前缀 “translate to :” 即可。

📦 安装指南

要使用这个模型，你需要安装transformers库。可以使用以下命令进行安装：

pip install transformers

💻 使用示例

基础用法

以下是一个从俄语翻译成中文的基础示例：

from transformers import T5ForConditionalGeneration, T5Tokenizer

device = 'cuda' # 或者使用 'cpu' 在CPU上进行翻译

model_name = 'utrobinmv/t5_translate_en_ru_zh_small_1024'
model = T5ForConditionalGeneration.from_pretrained(model_name)
model.to(device)
tokenizer = T5Tokenizer.from_pretrained(model_name)

prefix = 'translate to zh: '
src_text = prefix + "Цель разработки — предоставить пользователям личного синхронного переводчика."

# 从俄语翻译成中文
input_ids = tokenizer(src_text, return_tensors="pt")

generated_tokens = model.generate(**input_ids.to(device))

result = tokenizer.batch_decode(generated_tokens, skip_special_tokens=True)
print(result)
# 开发的目的就是向用户提供个性化的同步翻译。

高级用法

你可以根据需要调整模型参数，例如在不同的设备（CPU或GPU）上进行翻译。以下是一个在CPU上进行翻译的示例：

from transformers import T5ForConditionalGeneration, T5Tokenizer

device = 'cpu' # 在CPU上进行翻译

model_name = 'utrobinmv/t5_translate_en_ru_zh_small_1024'
model = T5ForConditionalGeneration.from_pretrained(model_name)
model.to(device)
tokenizer = T5Tokenizer.from_pretrained(model_name)

prefix = 'translate to zh: '
src_text = prefix + "Цель разработки — предоставить пользователям личного синхронного переводчика."

# 从俄语翻译成中文
input_ids = tokenizer(src_text, return_tensors="pt")

generated_tokens = model.generate(**input_ids.to(device))

result = tokenizer.batch_decode(generated_tokens, skip_special_tokens=True)
print(result)
# 开发的目的就是向用户提供个性化的同步翻译。

📚 详细文档

支持的语言对

该模型支持以下语言对的翻译：

ru-zh：俄语到中文
zh-ru：中文到俄语
en-zh：英语到中文
zh-en：中文到英语
en-ru：英语到俄语
ru-en：俄语到英语

翻译前缀

在进行翻译时，需要在源文本前加上目标语言标识符前缀 “translate to :”，其中是目标语言的缩写，例如：

翻译成中文：translate to zh:
翻译成俄语：translate to ru:
翻译成英语：translate to en:

🔧 技术细节

本模型是一个经过精确配置的T5变压器模型，用于多语言机器翻译。它可以直接在俄语、中文和英语之间进行翻译，并且支持多语言源文本。在进行翻译时，模型会根据输入的目标语言标识符前缀生成相应的翻译结果。

📄 许可证

本项目采用Apache 2.0许可证。

📋 模型信息

属性	详情
模型类型	T5变压器模型
训练数据	ccmatrix
评估指标	sacrebleu

🔍 示例展示

示例标题	输入文本	输出结果
translate zh-ru	translate to ru: 开发的目的是为用户提供个人同步翻译。	Цель разработки - предоставить персонализированный синхронный перевод для пользователей.
translate ru-en	translate to en: Цель разработки — предоставить пользователям личного синхронного переводчика.	The purpose of the development is to provide users with a personal synchronized interpreter.
translate en-ru	translate to ru: The purpose of the development is to provide users with a personal synchronized interpreter.	Цель разработки — предоставить пользователям личного синхронного переводчика.
translate en-zh	translate to zh: The purpose of the development is to provide users with a personal synchronized interpreter.	开发的目的是为用户提供个人同步解释器。
translate zh-en	translate to en: 开发的目的是为用户提供个人同步解释器。	The purpose of the development is to provide users with a personal synchronized interpreter.
translate ru-zh	translate to zh: Цель разработки — предоставить пользователям личного синхронного переводчика.	开发的目的就是向用户提供个性化的同步翻译。