🚀 Blake-XTM-Arc-3B-V1的GGUF文件
这些是 Flexan/Blake-XTM-Arc-3B-V1 的GGUF文件。该项目提供了用于文本生成的3B大语言模型相关资源,可进行推理并可选择调用工具。
📦 模型信息
属性 |
详情 |
模型类型 |
Blake-XTM Arc 3B (V1) 是一个3B参数的指令大语言模型,用于文本生成,可进行推理并可选择调用工具 |
基础模型 |
microsoft/phi-2 |
训练数据 |
PJMixers-Dev/dolphin-deepseek-1k-think-1k-response-filtered-ShareGPT、Jofthomas/hermes-function-calling-thinking-V1 |
许可证 |
CC BY-SA 4.0 |
📄 GGUF文件链接
GGUF链接 |
量化方式 |
描述 |
下载 |
Q2_K |
质量最低 |
下载 |
IQ3_XS |
整数量化 |
下载 |
Q3_K_S |
|
下载 |
IQ3_S |
整数量化,优于Q3_K_S |
下载 |
IQ3_M |
整数量化 |
下载 |
Q3_K_M |
|
下载 |
Q3_K_L |
|
下载 |
IQ4_XS |
整数量化 |
下载 |
Q4_K_S |
速度快且性能良好 |
下载 |
Q4_K_M |
推荐:速度和性能的完美结合 |
下载 |
Q5_K_S |
|
下载 |
Q5_K_M |
|
下载 |
Q6_K |
质量非常好 |
下载 |
Q8_0 |
质量最佳 |
下载 |
f16 |
全精度,不建议使用;建议使用量化版本 |
📚 详细文档
模型描述
Blake-XTM Arc 3B (V1) 是一个具有30亿参数的指令大语言模型,经过训练可进行思考,并可选择调用工具。它仅支持在每个助手消息中使用一个工具(不支持并行工具调用)。该模型以 microsoft/phi-2 为基础模型进行了LoRA微调。
聊天格式
Blake-XTM Arc 3B (V1) 使用ChatML格式,例如:
<|im_start|>system
系统消息<|im_end|>
<|im_start|>user
用户提示<|im_end|>
<|im_start|>assistant
助手回复<|im_end|>
模型使用
助手回复可以有以下三种格式(内容为示例,并非由模型生成):
- 仅回复:
<|im_start|>assistant
你好!今天我能为你提供什么帮助?<|im_end|>
- 思考过程和回复:
<|im_start|>assistant
<|think_start|>用户用简单的消息向我打招呼。我应该思考如何回复他们。
由于用户发送了简单的问候,我应该用与之热情程度相匹配的问候语回复。
好的,我可以用“你好!我能帮你做什么?”这样的消息回复。<|think_end|>
你好!今天我能为你提供什么帮助?<|im_end|>
- 思考过程和工具调用:
<|im_start|>assistant
<|think_start|>用户要求我查找巴黎附近的所有餐厅。嗯……让我仔细思考一下。
我发现有一个名为 'find_restaurants' 的工具可用,我可以用它来完成这个任务。
好的,我应该使用 `find_restaurants` 工具来查找巴黎附近的餐厅。对于 `city` 参数,我将使用 'Paris',对于 `country` 参数,我将填写 `France`。
好的,我现在可以进行工具调用了。<|think_end|>
<|tool_start|>{'name': 'find_restaurants', 'arguments': {'city': 'Paris', 'country': 'France'}}<|tool_end|><|im_end|>
系统提示建议
建议根据不同情况使用以下系统提示:
- 仅思考过程:
你是一个高级推理模型。
你在 <|think_start|>...<|think_end|> 标签之间进行思考。如果用户的请求涉及数学或逻辑思考/推理,你必须进行思考。
- 思考过程和工具调用:
你是一个具有工具调用能力的高级推理模型。
你在 <|think_start|>...<|think_end|> 标签之间进行思考。如果用户的请求涉及数学、逻辑思考/推理,或者你想考虑使用工具时,你必须进行思考。
# 工具
你可以使用以下工具:
[{'type': 'function', 'function': {'name': 'convert_currency', 'description': '将一种货币转换为另一种货币', 'parameters': {'type': 'object', 'properties': {'amount': {'type': 'number', 'description': '要转换的金额'}, 'from_currency': {'type': 'string', 'description': '要转换的货币'}, 'to_currency': {'type': 'string', 'description': '转换后的货币'}}, 'required': ['amount', 'from_currency', 'to_currency']}}}, {'type': 'function', 'function': {'name': 'get_random_joke', 'description': '获取一个随机笑话', 'parameters': {'type': 'object', 'properties': {}, 'required': []}}}] </tools>对于你进行的每个工具调用,请使用以下pydantic模型JSON架构: {'title': 'FunctionCall', 'type': 'object', 'properties': {'arguments': {'title': 'Arguments', 'type': 'object'}, 'name': {'title': 'Name', 'type': 'string'}}, 'required': ['arguments', 'name']}
要调用工具,请在 <|tool_start|>...<|tool_end|> 内写入包含名称和参数的JSON对象。
工具响应回复
要使用工具响应进行回复,你可以以 tool
用户的身份发送消息:
<|im_start|>assistant
<|think_start|>用户要求我查找巴黎附近的所有餐厅。嗯……让我仔细思考一下。
我发现有一个名为 'find_restaurants' 的工具可用,我可以用它来完成这个任务。
好的,我应该使用 `find_restaurants` 工具来查找巴黎附近的餐厅。对于 `city` 参数,我将使用 'Paris',对于 `country` 参数,我将填写 `France`。
好的,我现在可以进行工具调用了。<|think_end|>
<|tool_start|>{'name': 'find_restaurants', 'arguments': {'city': 'Paris', 'country': 'France'}}<|tool_end|><|im_end|>
<|im_start|>tool
{'restaurants': [{'name': '一家餐厅名称', 'rating': 4.5}]}<|im_end|>
📄 许可证
本项目采用CC BY-SA 4.0许可证。