MistralAI Devstral-Small-2507开源模型 - 多量化类型适配不同硬件需求

Mistralai Devstral Small 2507 GGUF

由 bartowski 开发

这是MistralAI Devstral-Small-2507模型的量化版本，使用llama.cpp工具进行量化处理，提供多种量化类型以满足不同硬件和性能需求。

下载量 1,584

发布时间 : 7/10/2025

模型简介

该模型是MistralAI Devstral-Small-2507的量化版本，支持多语言文本生成任务，适用于多种硬件环境。

多语言支持

支持多种语言，包括英语、法语、德语、西班牙语等。

多种量化类型

提供丰富的量化类型，以平衡模型质量和文件大小。

在线重新打包

部分量化类型支持在线重新打包权重，以提高特定硬件的性能。

文本生成

多语言支持

量化模型优化

文本生成

多语言文本生成

使用该模型生成多种语言的文本内容。

本项目是对MistralAI的Devstral - Small - 2507模型进行量化处理的成果。使用llama.cpp工具，为用户提供了多种量化类型的模型文件，以满足不同的硬件和性能需求。

<s>[SYSTEM_PROMPT]{system_prompt}[/SYSTEM_PROMPT][INST]{prompt}[/INST]

首先，确保你已经安装了huggingface - cli：

pip install -U "huggingface_hub[cli]"

然后，你可以指定要下载的特定文件：

huggingface-cli download bartowski/mistralai_Devstral-Small-2507-GGUF --include "mistralai_Devstral-Small-2507-Q4_K_M.gguf" --local-dir ./

如果模型文件大于50GB，它会被分割成多个文件。要将它们全部下载到本地文件夹，请运行：

huggingface-cli download bartowski/mistralai_Devstral-Small-2507-GGUF --include "mistralai_Devstral-Small-2507-Q8_0/*" --local-dir ./

你可以指定一个新的本地目录，或者将它们全部下载到当前目录。

属性	详情
量化者	bartowski
任务类型	image - text - to - text
支持语言	英语、法语、德语、西班牙语、葡萄牙语、意大利语、日语、韩语、俄语、中文、阿拉伯语、波斯语、印尼语、马来语、尼泊尔语、波兰语、罗马尼亚语、塞尔维亚语、瑞典语、土耳其语、乌克兰语、越南语、印地语、孟加拉语
基础模型	mistralai/Devstral - Small - 2507
基础模型关系	量化
许可证	apache - 2.0
推理	否

部分量化类型（如Q3_K_XL、Q4_K_L等）采用标准量化方法，将嵌入和输出权重量化为Q8_0，而非默认设置。

首先，确定你能运行的模型大小，这取决于你的RAM和/或VRAM容量。
- 若要模型运行速度最快，选择文件大小比GPU的VRAM小1 - 2GB的量化文件。
- 若要追求最高质量，将系统RAM和GPU的VRAM相加，选择比该总和小1 - 2GB的量化文件。
然后，决定使用“I - quant”还是“K - quant”。
- 若不想过多考虑，选择K - quant，格式为“QX_K_X”，如Q5_K_M。
- 若想深入了解，可查看[llama.cpp特性矩阵](https://github.com/ggerganov/llama.cpp/wiki/Feature - matrix)。一般来说，若目标是低于Q4且使用cuBLAS（Nvidia）或rocBLAS（AMD），应选择I - quant，格式为IQX_X，如IQ3_M。I - quant较新，相同大小下性能更好，但在CPU上使用比K - quant慢。