语言:
- 波斯语
- 多语言
缩略图: https://upload.wikimedia.org/wikipedia/commons/a/a2/Farsi.svg
标签:
- 机器翻译
- mt5
- 波斯语
许可证: mit
数据集:
- parsinlu
指标:
- sacrebleu
机器翻译模型
这是一个基于mT5的波斯语到英语机器翻译模型。
使用方法示例如下:
from transformers import MT5ForConditionalGeneration, MT5Tokenizer
model_name = "SeyedAli/Persian-to-English-Translation-mT5-V1"
tokenizer = MT5Tokenizer.from_pretrained(model_name)
model = MT5ForConditionalGeneration.from_pretrained(model_name)
def run_model(input_string, **generator_args):
input_ids = tokenizer.encode(input_string, return_tensors="pt")
res = model.generate(input_ids, **generator_args)
output = tokenizer.batch_decode(res, skip_special_tokens=True)
print(output)
return output
run_model("ستایش خدای را که پروردگار جهانیان است。")
run_model("در هاید پارک کرنر بر گلدانی ایستاده موعظه میکند;")
run_model("وی از تمامی بلاگرها، سازمانها و افرادی که از وی پشتیبانی کردهاند, تشکر کرد。")
run_model("مشابه سال ۲۰۰۱، تولید آمونیاک بی آب در ایالات متحده در سال ۲۰۰۰ تقریباً ۱۷،۴۰۰،۰۰۰ تن (معادل بدون آب) با مصرف ظاهری ۲۲،۰۰۰،۰۰۰ تن و حدود ۴۶۰۰۰۰۰ با واردات خالص مواجه شد。 ")
run_model("می خواهم دکترای علوم کامپیوتر راجع به شبکه های اجتماعی را دنبال کنم، چالش حل نشده در شبکه های اجتماعی چیست?")
预期输出结果可能包含以下翻译版本:
['赞美主宰世界的真主。']
['在海德公园角落的花坛上进行布道;']
['他向所有支持过他的博主、组织和个人致谢']
['与2001年类似,2000年美国无水氨产量约为']
['我想攻读社交网络方向的计算机科学博士学位,该领域尚未解决的挑战是']
其他可能的翻译版本:
['称颂宇宙之主安拉。']
['站在海德公园角落的花盆上宣讲教义;']
['她感谢所有支持她的博主、机构和男士们。']
['2000年美国无水氨产量接近']
['我打算研究社交网络方向的计算机博士,其中未解的难题是']
也可能生成如下译文:
['礼赞世间万物的主宰真主。']
['海德公园角落的传教士站在花瓶旁讲道;']
['他对所有支持过他的博主、组织和个人表达了感谢。']
['2001年同样地,美国无水氨的产量']
['我希望继续研究社交网络方向的计算机科学,该领域']