Synthia-v3.0-11B开源通用大语言模型 - 支持思维树推理与长对话

首页

Synthia V3.0 11B

由 migtissera 开发

SynthIA-v3.0-11B是一款通用大语言模型，基于SynthIA-v3.0数据集训练，支持思维树推理和长对话。

大型语言模型

Transformers

开源协议:Apache-2.0 #思维链推理 #长对话优化 #GPT-4微调

下载量 1,125

发布时间 : 12/14/2023

模型简介

该模型依据LIMA论文原则训练，使用GPT-4-Turbo生成的高质量样本进行微调，擅长遵循指令和进行长对话。

模型特点

广义思维树推理

支持思维树推理和回溯，构建清晰连贯的思维链

长对话优化

经过微调可进行长对话交互

高质量训练数据

使用GPT-4-Turbo生成的约10000个高质量样本训练

模型能力

文本生成

指令遵循

长对话处理

思维链推理

使用案例

对话系统

智能助手

可作为智能助手进行长对话交互

教育

知识问答

回答各类知识性问题并进行详细解释

🚀 Synthia-v3.0-11B

SynthIA-v3.0-11B（合成智能代理）是一款通用大语言模型（LLM）。它基于Synthia-v3.0数据集进行训练，该数据集包含广义思维树提示以及10种全新的长格式系统上下文。

此模型依据LIMA（少即是多的对齐方式）论文的原则进行训练，使用GPT - 4 - Turbo生成了约10000个高质量样本。它经过微调，能够遵循指令并进行长对话。

Synthia

若要唤起广义思维树 + 思维链推理，可使用以下系统消息：

运用思维树详细阐述主题，并在必要时回溯，以构建清晰、连贯的思维链推理。始终毫不犹豫地给出答案。

🚀 快速开始

✨ 主要特性

基于Synthia - v3.0数据集训练，包含广义思维树提示和新的长格式系统上下文。
依据LIMA论文原则，使用GPT - 4 - Turbo生成的高质量样本进行训练。
经过微调，可遵循指令并进行长对话。

📦 安装指南

文档未提及具体安装步骤，暂不提供。

💻 使用示例

基础用法

以下是提示格式：

SYSTEM: 运用思维树详细阐述主题，并在必要时回溯，以构建清晰、连贯的思维链推理。始终毫不犹豫地给出答案。
USER: 虎鲸、海豚和海豹有什么区别？
ASSISTANT:

高级用法

以下展示了如何使用该模型的代码示例：

import torch, json
from transformers import AutoModelForCausalLM, AutoTokenizer

model_path = "migtissera/Synthia-v3.0-11B"
output_file_path = "./Synthia-v3.0-11B-conversations.jsonl"

model = AutoModelForCausalLM.from_pretrained(
    model_path,
    torch_dtype=torch.float16,
    device_map="auto",
    load_in_8bit=False,
    trust_remote_code=True,
)

tokenizer = AutoTokenizer.from_pretrained(model_path, trust_remote_code=True)


def generate_text(instruction):
    tokens = tokenizer.encode(instruction)
    tokens = torch.LongTensor(tokens).unsqueeze(0)
    tokens = tokens.to("cuda")

    instance = {
        "input_ids": tokens,
        "top_p": 1.0,
        "temperature": 0.75,
        "generate_len": 1024,
        "top_k": 50,
    }

    length = len(tokens[0])
    with torch.no_grad():
        rest = model.generate(
            input_ids=tokens,
            max_length=length + instance["generate_len"],
            use_cache=True,
            do_sample=True,
            top_p=instance["top_p"],
            temperature=instance["temperature"],
            top_k=instance["top_k"],
            num_return_sequences=1,
        )
    output = rest[0][length:]
    string = tokenizer.decode(output, skip_special_tokens=True)
    answer = string.split("USER:")[0].strip()
    return f"{answer}"


conversation = f"SYSTEM: Elaborate on the topic using a Tree of Thoughts and backtrack when necessary to construct a clear, cohesive Chain of Thought reasoning. Always answer without hesitation."


while True:
    user_input = input("You: ")
    llm_prompt = f"{conversation} \nUSER: {user_input} \nASSISTANT: "
    answer = generate_text(llm_prompt)
    print(answer)
    conversation = f"{llm_prompt}{answer}"
    json_data = {"prompt": user_input, "answer": answer}

    ## Save your conversation
    with open(output_file_path, "a") as output_file:
        output_file.write(json.dumps(json_data) + "\n")