D

Deepthought MOE 8X3B R1 Llama 3.2 Reasoning 18B Gguf

由 DavidAU 开发
一个8X3B的专家混合模型,激活了4/8个专家,每个模型都配备了推理技术,总参数为24B,但模型大小仅为18.4B。适用于创意和非创意用例以及通用用途。
下载量 148
发布时间 : 2/16/2025
模型介绍
内容详情
替代品

模型简介

该模型由8个针对推理/思考微调的Llama 3.2 3B模型组成,适用于创意写作、问题解决、头脑风暴等任务。

模型特点

深度推理能力
模型能够进行长链推理和深度思考,适用于复杂问题解决。
创意写作支持
特别适合创意写作,如小说、情节生成、角色扮演等。
专家混合架构
由8个微调的Llama 3.2 3B模型组成,可根据需求激活1到8个专家。
高温度适应性
在高温度设置下(1+、2+等)仍能保持连贯性,生成更丰富的思考内容。

模型能力

文本生成
推理
问题解决
创意写作
头脑风暴
解谜
小说写作
情节生成
子情节生成
场景延续
角色扮演

使用案例

创意写作
科幻小说创作
生成完全发生在宇宙飞船驾驶舱内的故事,探讨孤立、牺牲和人类联系。
生成800-1000字的连贯故事,包含情感深度和情节发展。
爱情小说场景
生成一个发生在威尔士小镇书店的爱情场景,包含未言明的化学反应。
生成800-1000字的对话丰富场景,角色有独特声音和情感层次。
问题解决
逻辑谜题解决
解决复杂的逻辑谜题和谜语,超出标准Llama 3.2模型能力范围的问题。
提供逐步推理和解决方案,展示深度思考能力。
头脑风暴
为新的'黑镜'剧集想出六个涉及时间旅行的情节。
生成六个独特且观众会喜欢的情节创意。