🚀 Seed-X-PPO-7B
Seed-X 是一系列强大的开源多语言翻译语言模型,涵盖指令模型、强化学习模型和奖励模型。它在 70 亿参数的规模下,突破了翻译能力的界限,为翻译研究和应用提供了便捷、现成的工具。
🚀 快速开始
📮 注意事项
⚠️ 重要提示
- 提示词末尾的语言标签必不可少,这些标签用于 PPO 训练。例如,当目标语言为德语时,需要添加
<de>
。语言缩写可参考上述表格。
- 此模型专门用于多语言翻译,不支持其他任务。
- 本模型没有聊天模板,因此无需执行
tokenizer.apply_chat_template
。请避免以多轮对话的格式向模型提问。
- 不建议使用非官方量化版本进行本地部署。我们将尽快发布官方量化模型,并在 Hugging Face Space 上开发演示。
以下是一个使用 vllm
加载模型并进行翻译的简单示例:
基础用法
from vllm import LLM, SamplingParams, BeamSearchParams
model_path = "./ByteDance-Seed/Seed-X-PPO-7B"
model = LLM(model=model_path,
max_num_seqs=512,
tensor_parallel_size=8,
enable_prefix_caching=True,
gpu_memory_utilization=0.95)
messages = [
"Translate the following English sentence into Chinese:\nMay the force be with you <zh>",
"Translate the following English sentence into Chinese and explain it in detail:\nMay the force be with you <zh>"
]
decoding_params = BeamSearchParams(beam_width=4,
max_tokens=512)
decoding_params = SamplingParams(temperature=0,
max_tokens=512,
skip_special_tokens=True)
results = model.generate(messages, decoding_params)
responses = [res.outputs[0].text.strip() for res in results]
print(responses)
推荐环境
推荐使用的版本:vllm==0.8.0
,transformers==4.51.3
✨ 主要特性
- 卓越的翻译能力:经人工评估和自动指标验证,Seed-X 展现了最先进的翻译能力,与 Gemini-2.5、Claude-3.5 和 GPT-4 等超大型模型相当或更优。
- 易于部署和推理:拥有紧凑的 70 亿参数和米斯特拉尔架构,Seed-X 在轻量级和高效的封装中提供了出色的翻译性能,非常适合部署和推理。
- 广泛的领域覆盖:在涵盖互联网、科技、办公对话、电子商务、生物医学、金融、法律、文学和娱乐等多个领域的极具挑战性的翻译测试集上表现出色。
📦 安装指南
文档未提及安装步骤,故跳过此章节。
💻 使用示例
见快速开始部分的代码示例。
📚 详细文档
支持语言
语言 |
缩写 |
语言 |
缩写 |
语言 |
缩写 |
语言 |
缩写 |
阿拉伯语 |
ar |
法语 |
fr |
马来语 |
ms |
俄语 |
ru |
捷克语 |
cs |
克罗地亚语 |
hr |
书面挪威语 |
nb |
瑞典语 |
sv |
丹麦语 |
da |
匈牙利语 |
hu |
荷兰语 |
nl |
泰语 |
th |
德语 |
de |
印尼语 |
id |
挪威语 |
no |
土耳其语 |
tr |
英语 |
en |
意大利语 |
it |
波兰语 |
pl |
乌克兰语 |
uk |
西班牙语 |
es |
日语 |
ja |
葡萄牙语 |
pt |
越南语 |
vi |
芬兰语 |
fi |
韩语 |
ko |
罗马尼亚语 |
ro |
中文 |
zh |
模型下载
模型名称 |
描述 |
下载 |
Seed-X-Instruct |
经过指令微调,以符合用户意图。 |
🤗 模型 |
👉 Seed-X-PPO |
经过强化学习训练,以提升翻译能力。 |
🤗 模型 |
Seed-X-RM |
奖励模型,用于评估翻译质量。 |
🤗 模型 |
评估
我们在一系列多样化的翻译基准测试中对 Seed-X 进行了评估,包括 FLORES - 200、WMT - 25 以及一个公开的挑战集,并进行了人工评估。
如需详细的基准测试结果和分析,请参考我们的技术报告。
🔧 技术细节
文档未提供具体的技术实现细节,故跳过此章节。
📄 许可证
本项目采用 OpenMDW 许可证。详情请参阅 LICENSE 文件。
引用
如果您发现 Seed-X 对您的研究和应用有帮助,请给我们点个星 ⭐ 或使用以下 BibTeX 格式引用我们:
@misc{cheng2025seedxbuildingstrongmultilingual,
title={Seed-X: Building Strong Multilingual Translation LLM with 7B Parameters},
author={Shanbo Cheng and Yu Bao and Qian Cao and Luyang Huang and Liyan Kang and Zhicheng Liu and Yu Lu and Wenhao Zhu and Jingwen Chen and Zhichao Huang and Tao Li and Yifu Li and Huiying Lin and Sitong Liu and Ningxin Peng and Shuaijie She and Lu Xu and Nuo Xu and Sen Yang and Runsheng Yu and Yiming Yu and Liehao Zou and Hang Li and Lu Lu and Yuxuan Wang and Yonghui Wu},
year={2025},
eprint={2507.13618},
archivePrefix={arXiv},
primaryClass={cs.CL},
url={https://arxiv.org/abs/2507.13618},
}
模型信息
属性 |
详情 |
模型类型 |
因果语言模型 |
训练阶段 |
预训练和后训练 |
支持内容 |
28 种语言的多语言翻译 |
数据集 |
facebook/flores、google/wmt24pp |
评估指标 |
bleurt、comet |
任务类型 |
翻译 |