Mistral-7B-Instruct-v0.3开源大语言模型 - 支持函数调用与扩展词汇表

首页

Mistral 7B Instruct V0.3

由 mistralai 开发

Mistral-7B-Instruct-v0.3 是基于 Mistral-7B-v0.3 进行指令微调的大型语言模型，支持函数调用和扩展词汇表。

大型语言模型

Transformers

开源协议:Apache-2.0 #指令微调 #函数调用支持 #多轮对话优化

下载量 709.57k

发布时间 : 5/22/2024

模型简介

这是一个指令微调的大型语言模型，专为遵循用户指令和函数调用而设计，适用于各种自然语言处理任务。

模型特点

扩展词汇表

词汇表扩展至 32768，提高了模型处理复杂文本的能力。

函数调用支持

支持工具调用和函数执行，增强了模型的实用性。

改进的分词器

使用 v3 分词器，提高了文本处理的效率和准确性。

模型能力

文本生成

指令跟随

函数调用

多轮对话

使用案例

对话系统

聊天机器人

可以作为智能聊天机器人，回答用户问题并提供帮助。

能够生成自然流畅的对话回复。

工具集成

天气查询

通过函数调用获取实时天气信息。

能够正确解析用户请求并调用天气API。

🚀 Mistral-7B-Instruct-v0.3大语言模型

Mistral-7B-Instruct-v0.3大语言模型（LLM）是Mistral-7B-v0.3的指令微调版本。它能基于特定指令完成各种自然语言处理任务，为用户提供准确、高效的语言交互体验。

🚀 快速开始

本模型建议搭配 mistral-inference 使用，如果你想使用Hugging Face transformers 生成文本，也可以参考后续的代码示例。

✨ 主要特性

与 Mistral-7B-v0.2 相比，Mistral-7B-v0.3 有以下改进：

词汇表扩展到32768
支持v3分词器
支持函数调用

📦 安装指南

建议使用 mistralai/Mistral-7B-Instruct-v0.3 搭配 mistral-inference 进行使用，使用以下命令进行安装：

pip install mistral_inference

💻 使用示例

基础用法

下载模型

from huggingface_hub import snapshot_download
from pathlib import Path

mistral_models_path = Path.home().joinpath('mistral_models', '7B-Instruct-v0.3')
mistral_models_path.mkdir(parents=True, exist_ok=True)

snapshot_download(repo_id="mistralai/Mistral-7B-Instruct-v0.3", allow_patterns=["params.json", "consolidated.safetensors", "tokenizer.model.v3"], local_dir=mistral_models_path)

聊天交互

安装 mistral_inference 后，环境中会出现 mistral-chat CLI 命令，你可以使用以下命令与模型进行对话：

mistral-chat $HOME/mistral_models/7B-Instruct-v0.3 --instruct --max_tokens 256

指令跟随

from mistral_inference.transformer import Transformer
from mistral_inference.generate import generate

from mistral_common.tokens.tokenizers.mistral import MistralTokenizer
from mistral_common.protocol.instruct.messages import UserMessage
from mistral_common.protocol.instruct.request import ChatCompletionRequest


tokenizer = MistralTokenizer.from_file(f"{mistral_models_path}/tokenizer.model.v3")
model = Transformer.from_folder(mistral_models_path)

completion_request = ChatCompletionRequest(messages=[UserMessage(content="Explain Machine Learning to me in a nutshell.")])

tokens = tokenizer.encode_chat_completion(completion_request).tokens

out_tokens, _ = generate([tokens], model, max_tokens=64, temperature=0.0, eos_id=tokenizer.instruct_tokenizer.tokenizer.eos_id)
result = tokenizer.instruct_tokenizer.tokenizer.decode(out_tokens[0])

print(result)

函数调用

from mistral_common.protocol.instruct.tool_calls import Function, Tool
from mistral_inference.transformer import Transformer
from mistral_inference.generate import generate

from mistral_common.tokens.tokenizers.mistral import MistralTokenizer
from mistral_common.protocol.instruct.messages import UserMessage
from mistral_common.protocol.instruct.request import ChatCompletionRequest


tokenizer = MistralTokenizer.from_file(f"{mistral_models_path}/tokenizer.model.v3")
model = Transformer.from_folder(mistral_models_path)

completion_request = ChatCompletionRequest(
    tools=[
        Tool(
            function=Function(
                name="get_current_weather",
                description="Get the current weather",
                parameters={
                    "type": "object",
                    "properties": {
                        "location": {
                            "type": "string",
                            "description": "The city and state, e.g. San Francisco, CA",
                        },
                        "format": {
                            "type": "string",
                            "enum": ["celsius", "fahrenheit"],
                            "description": "The temperature unit to use. Infer this from the users location.",
                        },
                    },
                    "required": ["location", "format"],
                },
            )
        )
    ],
    messages=[
        UserMessage(content="What's the weather like today in Paris?"),
        ],
)

tokens = tokenizer.encode_chat_completion(completion_request).tokens

out_tokens, _ = generate([tokens], model, max_tokens=64, temperature=0.0, eos_id=tokenizer.instruct_tokenizer.tokenizer.eos_id)
result = tokenizer.instruct_tokenizer.tokenizer.decode(out_tokens[0])

print(result)

高级用法

使用 `transformers` 生成文本

from transformers import pipeline

messages = [
    {"role": "system", "content": "You are a pirate chatbot who always responds in pirate speak!"},
    {"role": "user", "content": "Who are you?"},
]
chatbot = pipeline("text-generation", model="mistralai/Mistral-7B-Instruct-v0.3")
chatbot(messages)

使用 `transformers` 进行函数调用

使用此示例需要 transformers 版本为 4.42.0 或更高。更多信息请参考 transformers 文档中的函数调用指南。

from transformers import AutoModelForCausalLM, AutoTokenizer
import torch

model_id = "mistralai/Mistral-7B-Instruct-v0.3"
tokenizer = AutoTokenizer.from_pretrained(model_id)

def get_current_weather(location: str, format: str):
    """
    Get the current weather

    Args:
        location: The city and state, e.g. San Francisco, CA
        format: The temperature unit to use. Infer this from the users location. (choices: ["celsius", "fahrenheit"])
    """
    pass

conversation = [{"role": "user", "content": "What's the weather like in Paris?"}]
tools = [get_current_weather]


# format and tokenize the tool use prompt 
inputs = tokenizer.apply_chat_template(
            conversation,
            tools=tools,
            add_generation_prompt=True,
            return_dict=True,
            return_tensors="pt",
)

model = AutoModelForCausalLM.from_pretrained(model_id, torch_dtype=torch.bfloat16, device_map="auto")

inputs.to(model.device)
outputs = model.generate(**inputs, max_new_tokens=1000)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))

请注意，由于篇幅原因，此示例未展示完整的工具调用循环，即调用工具并将工具调用和工具结果添加到聊天历史中，以便模型在下次生成时使用。完整的工具调用示例请参考函数调用指南，并且Mistral 确实使用工具调用ID，因此这些ID必须包含在你的工具调用和工具结果中，它们应该正好是9个字母数字字符。

📚 详细文档

局限性

Mistral 7B Instruct 模型是一个快速演示，表明基础模型可以很容易地进行微调以实现出色的性能。它没有任何审核机制。我们期待与社区共同探讨如何使模型更好地遵循规则，以便在需要审核输出的环境中进行部署。

开发团队

Albert Jiang, Alexandre Sablayrolles, Alexis Tacnet, Antoine Roux, Arthur Mensch, Audrey Herblin-Stoop, Baptiste Bout, Baudouin de Monicault, Blanche Savary, Bam4d, Caroline Feldman, Devendra Singh Chaplot, Diego de las Casas, Eleonore Arcelin, Emma Bou Hanna, Etienne Metzger, Gianna Lengyel, Guillaume Bour, Guillaume Lample, Harizo Rajaona, Jean-Malo Delignon, Jia Li, Justus Murke, Louis Martin, Louis Ternon, Lucile Saulnier, Lélio Renard Lavaud, Margaret Jennings, Marie Pellat, Marie Torelli, Marie-Anne Lachaux, Nicolas Schuhl, Patrick von Platen, Pierre Stock, Sandeep Subramanian, Sophia Yang, Szymon Antoniak, Teven Le Scao, Thibaut Lavril, Timothée Lacroix, Théophile Gervet, Thomas Wang, Valera Nemychnikova, William El Sayed, William Marshall