Bielik-11B-v2.6-Instruct-GGUF开源波兰语大模型

首页

Bielik 11B V2.6 Instruct GGUF

由 speakleash 开发

Bielik-11B-v2.6-Instruct 是一个波兰语的大语言模型，由 SpeakLeash 和 ACK Cyfronet AGH 开发，基于 Bielik-11B-v2 微调而来，适用于指令跟随任务。

大型语言模型

Transformers

开源协议:Apache-2.0 #波兰语指令微调 #GGUF量化 #本地推理优化

下载量 206

发布时间 : 6/3/2025

模型简介

该模型是一个因果解码器架构的大语言模型，专门针对波兰语优化，支持指令跟随任务。

模型特点

波兰语优化

专门针对波兰语进行优化，适合波兰语文本生成和理解任务。

指令跟随

经过微调，能够更好地理解和执行用户指令。

多量化格式支持

提供多种量化格式（如 q4_k_m、q5_k_m、q6_k 等），适合不同硬件和性能需求。

模型能力

波兰语文本生成

指令跟随

对话系统

使用案例

对话系统

波兰语聊天助手

用于构建波兰语聊天助手，支持自然对话。

文本生成

波兰语内容创作

生成波兰语文章、故事或其他文本内容。

🚀 Bielik-11B-v2.6-Instruct-GGUF

本仓库包含适用于 SpeakLeash 的 Bielik-11B-v.2.6-Instruct 模型的 GGUF 格式文件。

⚠️ 重要提示

请注意，量化模型可能会降低响应质量并产生幻觉！

🚀 快速开始

可用的量化格式

q4_k_m：对一半的 attention.wv 和 feed_forward.w2 张量使用 Q6_K，其余使用 Q4_K。
q5_k_m：对一半的 attention.wv 和 feed_forward.w2 张量使用 Q6_K，其余使用 Q5_K。
q6_k：对所有张量使用 Q8_K。
q8_0：与 float16 几乎无差别。资源占用高且速度慢，不建议大多数用户使用。
16bit：将 fp16 转换为 GGUF 格式。

Ollama Modfile

GGUF 文件可与 Ollama 一起使用。为此，你需要使用 Modfile 中定义的配置导入模型。以 Bielik-11B-v2.6-Instruct.Q4_K_M.gguf 模型（模型的完整路径）为例，Modfile 如下：

FROM ./Bielik-11B-v2.6-Instruct.Q4_K_M.gguf

TEMPLATE """<s>{{ if .System }}<|start_header_id|>system<|end_header_id|>

{{ .System }}<|eot_id|>{{ end }}{{ if .Prompt }}<|start_header_id|>user<|end_header_id|>

{{ .Prompt }}<|eot_id|>{{ end }}<|start_header_id|>assistant<|end_header_id|>

{{ .Response }}<|eot_id|>"""

PARAMETER stop "<|start_header_id|>"
PARAMETER stop "<|end_header_id|>"
PARAMETER stop "<|eot_id|>"

# 请记住为实验性模型（1 - 3 位）设置较低的温度
PARAMETER temperature 0.1

📚 详细文档

模型描述

属性	详情
开发者	SpeakLeash 与 ACK Cyfronet AGH
语言	波兰语
模型类型	因果解码器
量化来源	Bielik-11B-v2.6-Instruct
微调来源	Bielik-11B-v2
许可证	Apache 2.0 和使用条款

关于 GGUF

GGUF 是 llama.cpp 团队于 2023 年 8 月 21 日推出的一种新格式。

以下是已知支持 GGUF 的客户端和库的不完全列表：

llama.cpp：GGUF 的源项目，提供 CLI 和服务器选项。
text-generation-webui：最广泛使用的 Web UI，具有许多功能和强大的扩展，支持 GPU 加速。
KoboldCpp：功能齐全的 Web UI，支持所有平台和 GPU 架构的 GPU 加速，尤其适合讲故事。
GPT4All：免费开源的本地运行 GUI，支持 Windows、Linux 和 macOS，具备完整的 GPU 加速。
LM Studio：适用于 Windows、macOS（Silicon）和 Linux 的易于使用且功能强大的本地 GUI，支持 GPU 加速。
LoLLMS Web UI：一个很棒的 Web UI，具有许多有趣和独特的功能，包括一个完整的模型库，便于模型选择。
Faraday.dev：适用于 Windows 和 macOS（Silicon 和 Intel）的有吸引力且易于使用的基于角色的聊天 GUI，支持 GPU 加速。
llama-cpp-python：支持 GPU 加速的 Python 库，支持 LangChain 和 OpenAI 兼容的 API 服务器。
candle：一个专注于性能的 Rust ML 框架，包括 GPU 支持和易用性。
ctransformers：支持 GPU 加速的 Python 库，支持 LangChain 和 OpenAI 兼容的 AI 服务器。请注意，ctransformers 很久没有更新，不支持许多最新的模型。