🚀 班图语 - 英语翻译模型
本项目提供了一个用于班图语到英语翻译的模型,支持多种班图语系语言的翻译,为跨语言交流提供了有力的工具。
🚀 快速开始
你可以通过以下链接下载模型的原始权重、测试集翻译和测试集评分:
✨ 主要特性
- 多语言支持:支持多种班图语系语言,包括斯瓦希里语(sn)、祖鲁语(zu)、卢旺达语(rw)等。
- 模型类型:采用Transformer模型进行翻译任务。
- 预处理:使用归一化和SentencePiece(spm32k,spm32k)进行预处理。
📚 详细文档
翻译信息
- 源语言组:班图语系语言
- 目标语言组:英语
- OPUS说明文档:bnt-eng
模型信息
属性 |
详情 |
模型类型 |
Transformer |
源语言 |
kin、lin、lug、nya、run、sna、swh、toi_Latn、tso、umb、xho、zul |
目标语言 |
eng |
预处理 |
归一化 + SentencePiece(spm32k,spm32k) |
系统信息
- Hugging Face名称:bnt-eng
- 源语言:bnt
- 目标语言:eng
- OPUS说明文档URL:https://github.com/Helsinki-NLP/Tatoeba-Challenge/tree/master/models/bnt-eng/README.md
- 原始仓库:Tatoeba-Challenge
- 标签:['translation']
- 支持语言:['sn', 'zu', 'rw', 'lg', 'ts', 'ln', 'ny', 'xh', 'rn', 'bnt', 'en']
- 源语言成分:{'sna', 'zul', 'kin', 'lug', 'tso', 'lin', 'nya', 'xho', 'swh', 'run', 'toi_Latn', 'umb'}
- 目标语言成分:{'eng'}
- 源语言多语言性:True
- 目标语言多语言性:False
- 预处理:归一化 + SentencePiece(spm32k,spm32k)
- 模型URL:https://object.pouta.csc.fi/Tatoeba-MT-models/bnt-eng/opus2m-2020-07-31.zip
- 测试集URL:https://object.pouta.csc.fi/Tatoeba-MT-models/bnt-eng/opus2m-2020-07-31.test.txt
- 源语言ISO 639-3代码:bnt
- 目标语言ISO 639-3代码:eng
- 短语言对:bnt-en
- chrF2评分:0.39399999999999996
- BLEU评分:23.1
- 简洁惩罚:1.0
- 参考长度:14565.0
- 源语言名称:班图语系语言
- 目标语言名称:英语
- 训练日期:2020-07-31
- 源语言ISO 639-2代码:bnt
- 目标语言ISO 639-2代码:en
- 是否偏好旧版本:False
- 长语言对:bnt-eng
- 赫尔辛基Git SHA:480fcbe0ee1bf4774bcbe6226ad9f58e63f6c535
- Transformers Git SHA:2207e5d8cb224e954a7cba69fa4ac2309e9ff30b
- 移植机器:brutasse
- 移植时间:2020-08-21-14:41
📊 基准测试
测试集 |
BLEU |
chr-F |
Tatoeba-test.kin-eng.kin.eng |
31.7 |
0.481 |
Tatoeba-test.lin-eng.lin.eng |
8.3 |
0.271 |
Tatoeba-test.lug-eng.lug.eng |
5.3 |
0.128 |
Tatoeba-test.multi.eng |
23.1 |
0.394 |
Tatoeba-test.nya-eng.nya.eng |
38.3 |
0.527 |
Tatoeba-test.run-eng.run.eng |
26.6 |
0.431 |
Tatoeba-test.sna-eng.sna.eng |
27.5 |
0.440 |
Tatoeba-test.swa-eng.swa.eng |
4.6 |
0.195 |
Tatoeba-test.toi-eng.toi.eng |
16.2 |
0.342 |
Tatoeba-test.tso-eng.tso.eng |
100.0 |
1.000 |
Tatoeba-test.umb-eng.umb.eng |
8.4 |
0.231 |
Tatoeba-test.xho-eng.xho.eng |
37.2 |
0.554 |
Tatoeba-test.zul-eng.zul.eng |
40.9 |
0.576 |
📄 许可证
本项目采用Apache 2.0许可证。