额外授权标题:确认许可以接受仓库
额外授权按钮内容:确认许可
管道标签:翻译
库名称:comet
语言:
- 多语言
- 南非荷兰语
- 阿姆哈拉语
- 阿拉伯语
- 阿萨姆语
- 阿塞拜疆语
- 白俄罗斯语
- 保加利亚语
- 孟加拉语
- 布列塔尼语
- 波斯尼亚语
- 加泰罗尼亚语
- 捷克语
- 威尔士语
- 丹麦语
- 德语
- 希腊语
- 英语
- 世界语
- 西班牙语
- 爱沙尼亚语
- 巴斯克语
- 波斯语
- 芬兰语
- 法语
- 弗里斯兰语
- 爱尔兰语
- 苏格兰盖尔语
- 加利西亚语
- 古吉拉特语
- 豪萨语
- 希伯来语
- 印地语
- 克罗地亚语
- 匈牙利语
- 亚美尼亚语
- 印度尼西亚语
- 冰岛语
- 意大利语
- 日语
- 爪哇语
- 格鲁吉亚语
- 哈萨克语
- 高棉语
- 卡纳达语
- 韩语
- 库尔德语
- 吉尔吉斯语
- 拉丁语
- 老挝语
- 立陶宛语
- 拉脱维亚语
- 马尔加什语
- 马其顿语
- 马拉雅拉姆语
- 蒙古语
- 马拉地语
- 马来语
- 缅甸语
- 尼泊尔语
- 荷兰语
- 挪威语
- 奥罗莫语
- 奥里亚语
- 旁遮普语
- 波兰语
- 普什图语
- 葡萄牙语
- 罗马尼亚语
- 俄语
- 梵语
- 信德语
- 僧伽罗语
- 斯洛伐克语
- 斯洛文尼亚语
- 索马里语
- 阿尔巴尼亚语
- 塞尔维亚语
- 巽他语
- 瑞典语
- 斯瓦希里语
- 泰米尔语
- 泰卢固语
- 泰语
- 他加禄语
- 土耳其语
- 维吾尔语
- 乌克兰语
- 乌尔都语
- 乌兹别克语
- 越南语
- 科萨语
- 意第绪语
- 中文
许可证:cc-by-nc-sa-4.0
基础模型:
- microsoft/infoxlm-large
这是一个COMET质量评估模型:接收源语句及其相应翻译,返回反映翻译质量的分数。
论文
CometKiwi: IST-Unbabel 2022质量评估共享任务提交(Rei等人,WMT 2022)
许可证:
cc-by-nc-sa-4.0
使用(unbabel-comet)
使用此模型需要安装unbabel-comet:
pip install --upgrade pip
pip install "unbabel-comet>=2.0.0"
使用前请确认其许可证并登录Hugging Face hub:
huggingface-cli login
huggingface-cli login --token $HUGGINGFACE_TOKEN
然后可以通过comet CLI使用:
comet-score -s {源输入}.txt -t {翻译输出}.txt --model Unbabel/wmt22-cometkiwi-da
或使用Python:
from comet import download_model, load_from_checkpoint
model_path = download_model("Unbabel/wmt22-cometkiwi-da")
model = load_from_checkpoint(model_path)
data = [
{
"src": "输出信号提供恒定同步,因此显示从不闪烁。",
"mt": "Das Ausgangssignal bietet eine konstante Synchronisation, so dass die Anzeige nie stört."
},
{
"src": "插图圈面向所有10至15岁的艺术爱好者。",
"mt": "Кільце ілюстрації призначене для всіх любителів мистецтва у віці від 10 до 15 років."
},
{
"src": "曼德拉随后成为南非首位黑人总统,在其非洲国民大会党赢得1994年选举后。",
"mt": "その後、1994年の選挙でアフリカ国民会議派が勝利し、南アフリカ初の黒人大統領となった。"
}
]
model_output = model.predict(data, batch_size=8, gpus=1)
print(model_output)
预期用途
我们的模型旨在用于无参考的机器翻译评估。
给定源文本及其翻译,输出一个介于0和1之间的分数,其中1代表完美翻译。
覆盖语言:
此模型基于InfoXLM,覆盖以下语言:
南非荷兰语、阿尔巴尼亚语、阿姆哈拉语、阿拉伯语、亚美尼亚语、阿萨姆语、阿塞拜疆语、巴斯克语、白俄罗斯语、孟加拉语、罗马化孟加拉语、波斯尼亚语、布列塔尼语、保加利亚语、缅甸语、缅甸语、加泰罗尼亚语、简体中文、繁体中文、克罗地亚语、捷克语、丹麦语、荷兰语、英语、世界语、爱沙尼亚语、菲律宾语、芬兰语、法语、加利西亚语、格鲁吉亚语、德语、希腊语、古吉拉特语、豪萨语、希伯来语、印地语、罗马化印地语、匈牙利语、冰岛语、印度尼西亚语、爱尔兰语、意大利语、日语、爪哇语、卡纳达语、哈萨克语、高棉语、韩语、库尔德语(库尔曼吉语)、吉尔吉斯语、老挝语、拉丁语、拉脱维亚语、立陶宛语、马其顿语、马尔加什语、马来语、马拉雅拉姆语、马拉地语、蒙古语、尼泊尔语、挪威语、奥里亚语、奥罗莫语、普什图语、波斯语、波兰语、葡萄牙语、旁遮普语、罗马尼亚语、俄语、梵语、苏格兰盖尔语、塞尔维亚语、信德语、僧伽罗语、斯洛伐克语、斯洛文尼亚语、索马里语、西班牙语、巽他语、斯瓦希里语、瑞典语、泰米尔语、罗马化泰米尔语、泰卢固语、罗马化泰卢固语、泰语、土耳其语、乌克兰语、乌尔都语、罗马化乌尔都语、维吾尔语、乌兹别克语、越南语、威尔士语、西弗里西亚语、科萨语、意第绪语。
因此,包含未覆盖语言的语对结果不可靠!