M

Mt0 Xxl

由 bigscience 开发
mt0-xxl是BLOOMZ系列的多语言大模型,支持46种语言的跨语言任务处理,基于xP3数据集微调,擅长零样本跨语言指令执行
下载量 1,914
发布时间 : 10/19/2022
模型介绍
内容详情
替代品

模型简介

基于mT5架构的多语言大模型,通过xP3数据集微调实现跨语言任务泛化能力,支持文本生成、翻译、问答等多种任务

模型特点

多语言零样本学习
无需特定语言训练即可处理46种语言的指令任务
跨任务泛化
在xP3混合任务数据集上微调,可泛化到未见过的任务类型
多任务统一处理
统一框架处理翻译、问答、文本生成等多样化任务

模型能力

多语言文本生成
跨语言翻译
指代消解
自然语言推理
情感分析
问答系统
关键词提取

使用案例

语言服务
多语言翻译
支持46种语言间的互译(如蒙古语-英语)
保持语义准确性的跨语言转换
跨语言问答
用任意支持语言提问并获得多语言回答
在XWinograd测试集上准确率达76-81%
内容生成
多语言故事创作
根据指定语言和主题生成连贯文本(如西班牙语童话)
保持文化适应性的创意输出