E

ERNIE 4.5 300B A47B PT GGUF

由 unsloth 开发
ERNIE-4.5-300B-A47B 是一款文本 MoE 后训练模型,拥有 3000 亿的总参数,每个标记有 470 亿的激活参数。该模型具备多模态异构 MoE 预训练、高效扩展基础设施和特定模态后训练等先进技术,能在文本理解与生成、图像理解及跨模态推理等任务中表现出色。
下载量 1,633
发布时间 : 7/18/2025

模型简介

ERNIE-4.5-300B-A47B 是一个基于 MoE 架构的大语言模型,专注于文本理解与生成任务,同时具备跨模态推理能力。

模型特点

多模态异构 MoE 预训练
采用模态隔离路由、路由正交损失和多模态标记平衡损失,有效捕捉多模态信息
高效扩展基础设施
使用异构混合并行和分层负载均衡策略,支持 FP8 混合精度训练和细粒度重计算
特定模态后训练
针对不同任务进行监督微调(SFT)、直接偏好优化(DPO)和统一偏好优化(UPO)
长上下文支持
支持长达 131072 tokens 的上下文长度

模型能力

文本理解
文本生成
图像理解
跨模态推理
长文本处理

使用案例

信息检索与问答
网络搜索增强
结合参考文章和时间信息提供准确答案
能避免使用过时信息,提供权威来源的答案
内容创作
专业写作
生成态度鲜明、文采飞扬且有理有据的内容
产出具有逻辑性和权威性的专业文本
AIbase
智启未来,您的人工智能解决方案智库
简体中文