openbuddy-qwq-32b-v25.2q-200k开源多语言聊天机器人

首页

Openbuddy Qwq 32b V25.2q 200k

由 OpenBuddy 开发

专为增强量化推理能力优化的多语言聊天机器人，支持8种语言，基于Qwen/QwQ-32B模型开发

大型语言模型

Safetensors

支持多种语言开源协议:Apache-2.0 #多语言聊天助手 #20万词元长上下文 #量化推理优化

下载量 41

发布时间 : 4/19/2025

模型简介

OpenBuddy是一个开放的多语言聊天机器人助手，经过特殊优化以提升量化推理性能，推荐在3至8位量化场景中使用。

模型特点

增强量化推理能力

专门优化以提升3至8位量化场景下的推理性能

多语言支持

支持8种主要语言的文本生成和理解

长上下文处理

支持长达20万词元的上下文处理能力

安全内容控制

内置安全机制防止生成有害、歧视性或不适当内容

模型能力

多语言对话

长文本理解

知识问答

量化推理优化

使用案例

智能助手

多语言客服机器人

为企业提供多语言客户支持服务

可处理多种语言的客户咨询

教育辅助

帮助学生进行多语言学习和知识查询

提供截至2023年4月的知识支持

量化推理应用

边缘设备部署

在资源受限设备上部署量化模型

3-8位量化场景下的高效推理

🚀 ⚛️ Q 模型：优化增强量化推理能力

该模型经过特别优化，旨在提升量化推理性能，推荐在 3 至 8 位量化场景中使用。

🚀 快速开始

项目相关链接

GitHub 与使用指南：https://github.com/OpenBuddy/OpenBuddy
网站与演示：https://openbuddy.ai
本模型评估结果：Evaluation.txt

✨ 主要特性

此模型专门针对量化推理性能进行了优化，能在 3 至 8 位量化场景中表现出色。

📚 详细文档

模型信息

属性	详情
基础模型	Qwen/QwQ - 32B
上下文长度	200K Tokens
许可证	Apache 2.0

提示词格式

建议使用 transformers 库中的快速分词器，该分词器在 transformers 和 vllm 库中默认启用。其他实现（包括 sentencepiece）可能无法按预期工作，尤其是对于 <|role|>、<|says|> 和 <|end|> 等特殊标记。

<|role|>system<|says|>You(assistant) are a helpful, respectful and honest INTP - T AI Assistant named Buddy. You are talking to a human(user).
Always answer as helpfully and logically as possible, while being safe. Your answers should not include any harmful, political, religious, unethical, racist, sexist, toxic, dangerous, or illegal content. Please ensure that your responses are socially unbiased and positive in nature.
You cannot access the internet, but you have vast knowledge, cutoff: 2023 - 04.
You are trained by OpenBuddy team, (https://openbuddy.ai, https://github.com/OpenBuddy/OpenBuddy), not related to GPT or OpenAI.<|end|>
<|role|>user<|says|>History input 1<|end|>
<|role|>assistant<|says|>History output 1<|end|>
<|role|>user<|says|>History input 2<|end|>
<|role|>assistant<|says|>History output 2<|end|>
<|role|>user<|says|>Current input<|end|>
<|role|>assistant<|says|>

这种格式也在 tokenizer_config.json 中定义，这意味着您可以直接使用 vllm 部署类似 OpenAI 的 API 服务。更多信息，请参考 vllm 文档。