Mgpt

M

Mgpt

由 THUMT 开发

mGPT是基于mC4数据集预训练的多语言生成模型，支持101种语言，采用类似GPT-2的Transformer架构。

大型语言模型

#多语言文本生成 #101种语言支持 #无监督预训练

下载量 147

发布时间 : 3/2/2022

模型简介

mGPT是一个基于Transformer架构的多语言生成模型，通过因果语言建模目标在101种语言的mC4数据集上预训练。适用于文本生成和提示式下游任务适配。

模型特点

多语言支持

预训练涵盖101种语言，具有广泛的语言覆盖能力

无监督预训练

仅使用原始文本进行训练，无需人工标注数据

共享分词器

采用与mT5相同的分词器和词汇表，便于多模型协作

模型能力

多语言文本生成

提示式任务适配

长文本生成（最大1024 token）

使用案例

文本生成

多语言内容创作

生成不同语言的连贯文本内容

下游任务适配

提示式任务执行

通过设计提示词(prompt)适配各类NLP任务

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24