E

ERNIE 4.5 21B A3B PT GGUF

由 unsloth 开发
ERNIE-4.5-21B是一款强大的文本生成模型,基于先进的技术创新,在文本理解、生成等多方面表现出色。
下载量 2,310
发布时间 : 7/18/2025

模型简介

ERNIE-4.5-21B是一款基于MoE架构的文本生成模型,具备多模态异构预训练能力,支持高效的训练和推理架构,适用于多种应用场景。

模型特点

多模态异构MoE预训练
模型在文本和视觉两种模态上进行联合训练,采用模态隔离路由和路由正交损失等技术,确保多模态信息的有效表示。
高效扩展的基础设施
采用异构混合并行和分层负载均衡策略,支持FP8混合精度训练和细粒度的重计算方法,实现高性能推理。
特定模态的后训练
针对通用语言理解和生成、视觉语言理解等任务进行微调,采用有监督微调(SFT)和直接偏好优化(DPO)等方法。

模型能力

文本生成
文本理解
多模态推理
视觉语言理解

使用案例

自然语言处理
文本生成
根据用户输入的提示生成连贯的文本内容。
生成高质量的文本,适用于聊天机器人、内容创作等场景。
文本理解
理解并分析用户输入的文本内容。
适用于问答系统、文本分类等任务。
多模态应用
视觉语言理解
结合图像和文本信息进行跨模态推理。
适用于图像描述生成、视觉问答等任务。
AIbase
智启未来,您的人工智能解决方案智库
简体中文