高效量化部署

# 高效量化部署

Mistralai Mistral Small 3.2 24B Instruct 2506 GGUF

这是Mistral-Small-3.2-24B-Instruct-2506模型的Llamacpp imatrix量化版本，提供多种量化类型以满足不同硬件需求。

大型语言模型支持多种语言

Mistralai Devstral Small 2505 GGUF

Devstral-Small-2505的量化版本，支持多语言文本生成任务，适用于本地部署和推理。

大型语言模型支持多种语言

Seed Coder 8B Reasoning Bf16 Q6 K GGUF

这是一个基于ByteDance-Seed/Seed-Coder-8B-Reasoning-bf16转换的GGUF格式模型，适用于代码生成和推理任务。

大型语言模型

Nvidia OpenMath Nemotron 14B Kaggle GGUF

这是NVIDIA开源的14B参数数学大语言模型，经过llama.cpp量化处理，可在不同硬件条件下高效运行。

大型语言模型英语

Meta Llama 3.1 8B GGUF

Meta-Llama-3.1-8B的GGUF量化版本，基于llama.cpp工具生成，支持多语言文本生成任务。

大型语言模型支持多种语言

Llama 4 Scout 17B 16E Instruct GGUF

Llama-4-Scout-17B-16E-Instruct-GGUF是一款基于Llama-4-Scout-17B-16E-Instruct模型的量化版本，支持多语言处理，适用于聊天和指令任务。

大型语言模型

Transformers 支持多种语言

Meta Llama Llama 4 Scout 17B 16E Instruct Old GGUF

Llama-4-Scout-17B-16E-Instruct是Meta发布的17B参数指令微调大语言模型，经过量化处理以提高运行效率

大型语言模型支持多种语言

Minicpm O 2 6 Gguf

MiniCPM-o 2.6是一个多模态模型，支持视觉和语言任务，专为llama.cpp设计。

图像生成文本

Dolphin3.0 Llama3.2 1B GGUF

基于Llama3.2架构的1B参数量化模型，支持文本生成任务，适用于多种量化版本选择

大型语言模型英语

Qwen2 VL 7B GGUF

Qwen2-VL-7B 是一个视觉语言模型，提供多种量化版本的 GGUF 格式模型文件，适用于 llama.cpp 使用。

文本生成图像

Transformers 英语

Mixtral 8x22B Instruct V0.1 GGUF

基于mistralai/Mixtral-8x22B-Instruct-v0.1模型的GGUF量化版本，支持多语言文本生成任务

大型语言模型支持多种语言

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24