Llama-3.1-8B-Athena-Apollo-exp开源AI模型 - 支持指令跟随、角色扮演与创意写作

首页

Llama 3.1 8B Athena Apollo Exp

由 ZeroXClem 开发

通过MergeKit融合多款Llama-3.1架构模型的强大AI，擅长指令跟随、角色扮演和创意写作

大型语言模型

Transformers

英语开源协议:Apache-2.0 #多任务指令跟随 #沉浸式角色扮演 #逻辑推理增强

下载量 31

发布时间 : 4/4/2025

模型简介

整合多款基于Llama-3.1架构的先进模型，专为指令跟随、角色扮演、逻辑推理、编程和创意写作等任务优化，展现出卓越的通用能力。

模型特点

精准指令跟随

融合Tulu对齐与Apollo-exp/Athena-k的指令微调能力，生成高语境感知响应

沉浸式角色扮演

继承Athena系列多样角色设定与情感表达优势

创意结构化输出

支持创意写作、长文本小说化及形式逻辑建模

深度对话能力

融合Apollo-exp中类Claude风格的哲学对话微调

模型能力

文本生成

指令跟随

角色扮演

逻辑推理

编程辅助

创意写作

使用案例

对话式AI

角色扮演机器人

用于创建具有丰富情感表达和角色设定的对话机器人

教育研究

形式推理辅助

帮助进行形式逻辑建模和思维链任务

创意产业

创意写作辅助

支持小说创作和结构化创意输出

🚀 🧠 ZeroXClem-Llama-3.1-8B-Athena-Apollo-exp

ZeroXClem-Llama-3.1-8B-Athena-Apollo-exp 是一个强大的人工智能模型，它通过使用 MergeKit 进行 模型库存合并 构建而成。该模型融合了多个在 Hugging Face 上可用的基于 Llama-3.1 的强大且精细的模型，针对 指令遵循、角色扮演、逻辑推理、编码和创意写作 等任务进行了性能优化。

通过将多种不同的微调架构融合成一个统一的混合模型，这个模型在保留专业优势的同时，展现出了出色的通用能力。

🚀 快速开始

使用示例

基础用法

from transformers import AutoModelForCausalLM, AutoTokenizer

model_name = "ZeroXClem/Llama-3.1-8B-Athena-Apollo-exp"

tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name, torch_dtype="auto", device_map="auto")

prompt = "Explain quantum entanglement like I'm 10 years old."
inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
outputs = model.generate(**inputs, max_new_tokens=200)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))

Ollama 使用说明

ollama run hf.co/ZeroXClem/Llama-3.1-8B-Athena-Apollo-exp-Q4_K_M-GGUF

✨ 主要特性

出色的指令遵循能力 — 融合了如 Apollo-exp 和 Athena-k 等与 Tulu 对齐并经过指令微调的模型，能够提供高质量、具有上下文感知的回复。
沉浸式角色扮演与个性表达 — 得益于 Athena 多样化的角色扮演融合，具备强大的角色扮演人设和情感细腻度。
创意与结构化生成 — 通过整合 l2/l3 模型，支持创意写作、长上下文小说创作和形式逻辑建模。
深度对话能力 — 由于 Apollo-exp 中类似 Claude 的微调，增强了进行多层次和哲学性对话的能力。

📦 安装指南

文档未提供具体安装步骤，可参考使用示例中的代码进行模型加载。

📚 详细文档

🔧 合并详情

合并方法：model_stock
基础模型：mergekit-community/L3.1-Athena-l3-8B
数据类型：bfloat16
分词器来源：mergekit-community/L3.1-Athena-l3-8B

💡 参与合并的模型

以下模型共同促成了这个强大的融合模型：

rootxhacker/Apollo-exp-8B — 专注于在 Llama-3.1 变体上进行对齐、DPO 和 SFT 指令调整的丰富融合模型。
mergekit-community/L3.1-Athena-k-8B — 基于 Meta 的 Llama-3.1 基础进行的角色扮演和安全对齐的合并模型。
mergekit-community/L3.1-Athena-l2-8B — 通过 LoRA 增强的具有长上下文和创意能力的合并模型。
mergekit-community/L3.1-Athena-l-8B — 深度融入了基于 LoRA 的逻辑、心理学、讲故事等特定领域的模型。

🧪 配置信息

name: ZeroXClem-Llama-3.1-8B-Athena-Apollo-exp
base_model: mergekit-community/L3.1-Athena-l3-8B
dtype: bfloat16
merge_method: model_stock
models:
  - model: rootxhacker/Apollo-exp-8B
  - model: mergekit-community/L3.1-Athena-k-8B
  - model: mergekit-community/L3.1-Athena-l2-8B
  - model: mergekit-community/L3.1-Athena-l-8B
tokenizer_source: mergekit-community/L3.1-Athena-l3-8B