OpenChat开源语言模型 - 免费部署，有限数据实现高性能多轮对话

首页

Openchat

由 openchat 开发

OpenChat是一系列开源语言模型，在多样化且高质量的多轮对话数据集上进行了微调，旨在用有限的数据实现高性能。

大型语言模型

Transformers

英语开源协议:其他 #高效微调 #多轮对话 #开源LLM

下载量 1,786

发布时间 : 6/22/2023

模型简介

OpenChat是基于LLaMA和StarCoderPlus的开源语言模型，专注于多轮对话任务，通过精选的小规模高质量数据实现优异性能。

模型特点

高效数据利用

仅使用约6000条精选GPT-4对话数据进行微调即达到优异性能

多版本支持

提供标准版(2048上下文)和扩展版(8192上下文)满足不同需求

代码专用模型

OpenCoderPlus针对代码生成任务优化，基于StarCoderPlus架构

高性能表现

在Vicuna GPT-4评估中得分超过ChatGPT，AlpacaEval胜率近80%

模型能力

多轮对话生成

代码生成

自然语言理解

上下文感知响应

使用案例

对话系统

智能客服

构建高性能客服对话系统

在Vicuna评估中达到ChatGPT 105.7%性能

个人助手

开发个性化数字助手

支持长达8192token的上下文记忆

编程辅助

代码生成

基于自然语言描述生成代码

在代码任务上达到ChatGPT 102.5%性能

🚀 OpenChat：开源模型，少即是多

OpenChat 是一系列开源语言模型，在多样化且高质量的多轮对话数据集上进行了微调。仅使用从约 9 万条 ShareGPT 对话中筛选出的约 6000 条 GPT - 4 对话，OpenChat 旨在用有限的数据实现高性能。

✨ 主要特性

通用模型

OpenChat：基于 LLaMA - 13B（上下文长度 2048）
- 在 Vicuna GPT - 4 评估中，得分达到 ChatGPT 的 105.7%
- 在 AlpacaEval 中的胜率为 80.9%
- 仅使用 6000 条数据进行微调！！！
OpenChat - 8192：基于 LLaMA - 13B（上下文长度扩展至 8192）
- 在 Vicuna GPT - 4 评估中，得分达到 ChatGPT 的 106.6%
- 在 AlpacaEval 中的胜率为 79.5%

代码模型

OpenCoderPlus：基于 StarCoderPlus（原生上下文长度 8192）
- 在 Vicuna GPT - 4 评估中，得分达到 ChatGPT 的 102.5%
- 在 AlpacaEval 中的胜率为 78.7%

⚠️ 重要提示

请使用 bfloat16 加载预训练模型。

🚀 快速开始

代码与推理服务器

我们在 OpenChat GitHub 仓库中提供了完整的源代码，包括一个与“ChatCompletions”API 兼容的推理服务器。

Web 界面

OpenChat 还包含一个 Web 界面，以提供更好的用户体验。具体说明请参考 GitHub 仓库。

💻 使用示例

对话模板

对话模板 涉及拼接令牌。

除了基础模型词汇表外，还添加了一个回合结束令牌 <|end_of_turn|>，其 ID 为 eot_token_id。

# OpenChat
[bos_token_id] + tokenize("Human: ") + tokenize(user_question) + [eot_token_id] + tokenize("Assistant: ")
# OpenCoder
tokenize("User:") + tokenize(user_question) + [eot_token_id] + tokenize("Assistant:")

💡 使用建议

在字节对编码（BPE）中，tokenize(A) + tokenize(B) 并不总是等于 tokenize(A + B)。

以下是生成对话模板的代码：

@dataclass
class ModelConfig:
    # Prompt
    system: Optional[str]

    role_prefix: dict
    ai_role: str
    eot_token: str
    bos_token: Optional[str] = None

    # Get template
    def generate_conversation_template(self, tokenize_fn, tokenize_special_fn, message_list):
        tokens = []
        masks = []

        # begin of sentence (bos)
        if self.bos_token:
            t = tokenize_special_fn(self.bos_token)
            tokens.append(t)
            masks.append(False)

        # System
        if self.system:
            t = tokenize_fn(self.system) + [tokenize_special_fn(self.eot_token)]
            tokens.extend(t)
            masks.extend([False] * len(t))

        # Messages
        for idx, message in enumerate(message_list):
            # Prefix
            t = tokenize_fn(self.role_prefix[message["from"]])
            tokens.extend(t)
            masks.extend([False] * len(t))

            # Message
            if "value" in message:
                t = tokenize_fn(message["value"]) + [tokenize_special_fn(self.eot_token)]
                tokens.extend(t)
                masks.extend([message["from"] == self.ai_role] * len(t))
            else:
                assert idx == len(message_list) - 1, "Empty message for completion must be on the last."

        return tokens, masks


MODEL_CONFIG_MAP = {
    # OpenChat / OpenChat-8192
    "openchat": ModelConfig(
        # Prompt
        system=None,

        role_prefix={
            "human": "Human: ",
            "gpt": "Assistant: "
        },
        ai_role="gpt",
        eot_token="<|end_of_turn|>",
        bos_token="<s>",
    ),

    # OpenCoder / OpenCoderPlus
    "opencoder": ModelConfig(
        # Prompt
        system=None,

        role_prefix={
            "human": "User:",
            "gpt": "Assistant:"
        },
        ai_role="gpt",
        eot_token="<|end_of_turn|>",
        bos_token=None,
    )
}

📄 许可证

我们的模型权重许可证遵循其相应基础模型的规定。例如，OpenChat 和 OpenChat - 8192 与 LLaMA 的模型许可证相同，仅用于非商业用途；而 OpenCoderPlus 遵循 StarCoder 的许可证。此外，我们还需遵守 ShareGPT 的隐私政策。在 GitHub 上发布的代码遵循 Apache License 2.0。

📚 详细文档

引用信息

@software{openllms23,
  title = {{OpenLLMs: Less is More for Open-source Models}},
  author = {Wang, Guan and Cheng, Sijie and Yu, Qiying and Liu, Changling},
  doi = {10.5281/zenodo.8105775},
  url = {https://github.com/imoneoi/openchat},
  version = {pre-release},
  year = {2023},
  month = {7},
}