自回归模型

# 自回归模型

XGLM-564M 是一个多语言自回归语言模型，包含5.64亿参数，基于30种语言的平衡语料库训练，总计5000亿子词。

大型语言模型支持多种语言

Liquid 是一种自回归生成范式，通过将图像标记化为离散代码并在共享特征空间中学习这些代码嵌入与文本标记，实现了视觉理解与生成的无缝融合。

文本生成图像

Transformers 英语

Lumina Mgpt 7B 512

Lumina-mGPT是一个多模态自回归模型家族，擅长执行多种视觉与语言任务，特别是根据文本描述生成灵活逼真的图像。

文本生成图像

Lumina Mgpt 7B 1024

Lumina-mGPT 是一个多模态自回归模型家族，擅长根据文本描述生成灵活逼真的图像，并能执行多种视觉和语言任务。

文本生成图像

Lumina Mgpt 7B 768

Lumina-mGPT 是一个多模态自回归模型家族，擅长根据文本描述生成灵活逼真的图像，并能执行多种视觉与语言任务。

文本生成图像

Lumina Mgpt 7B 768 Omni

Lumina-mGPT 是一个多模态自回归模型系列，擅长根据文本描述生成灵活逼真的图像。

文本生成图像

Codellama 7b Instruct Hf

Code Llama是Meta发布的代码生成与理解模型系列，包含7B至34B参数的预训练与微调版本。本模型为7B参数的指令微调版，专为代码助手场景优化。

大型语言模型

Transformers 其他

Codellama 7b Hf

Code Llama是Meta推出的70亿到340亿参数规模的代码生成与理解模型系列，本版本为7B基础模型

大型语言模型

Transformers 其他

Gpt2 Turkish 128 Token GGUF

基于GPT-2架构的土耳其语文本生成模型，支持128词元长度的文本生成。

大型语言模型其他

Codellama 7b Python Hf

Code Llama是Meta推出的70亿参数Python专用代码生成模型，基于Llama 2架构优化，专注于Python代码合成与理解任务

大型语言模型

Transformers 其他

Perceiver Ar Sam Giant Midi

基于Perceiver AR架构的符号音频模型，在GiantMIDI-Piano数据集上预训练，用于符号音频生成

CodeGen2 是一系列用于程序合成的自回归语言模型，具备填充能力并支持多种编程语言。

大型语言模型

Codegen 350m Html

CodeGen-HTML 350M是基于CodeGen-Multi 350M微调的自回归语言模型，专门用于HTML代码生成。

大型语言模型

Transformers 其他

Codegen 350M Mono

CodeGen是一系列用于程序合成的自回归语言模型，基于Python编程语言数据集预训练。

大型语言模型

GPT Neo 1.3B Adventure

基于EleutherAI的GPT-Neo 1.3B模型微调而成的版本，专注于冒险类文本生成。

大型语言模型

Transformers 英语

XGLM-2.9B是一个多语言自回归语言模型，拥有29亿参数，基于5000亿子词的多样化语言平衡语料库训练而成。

大型语言模型

Transformers 支持多种语言

XGLM-4.5B 是一个多语言自回归语言模型，拥有45亿参数，基于134种语言的平衡语料库训练而成。

大型语言模型

Transformers 支持多种语言

XGLM-1.7B是一个多语言自回归语言模型，拥有17亿参数，基于5000亿子词标记的多样化语言平衡语料库训练而成。

大型语言模型

Transformers 支持多种语言

GPT-J 6B是基于Mesh Transformer JAX框架训练的60亿参数自回归语言模型，采用与GPT-2/3相同的分词器。

大型语言模型英语

GPT-Neo 125M是基于GPT-3架构的Transformer模型，由EleutherAI开发，参数量为1.25亿，主要用于英语文本生成任务。

大型语言模型英语

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24