低显存占用

# 低显存占用

Jan Nano是基于Qwen3架构微调的小型语言模型，专为本地和嵌入式环境设计，兼具高效性和长上下文处理能力。

大型语言模型

Nunchaku Flux.1 Schnell

Nunchaku量化的FLUX.1-schnell模型，用于根据文本提示生成高质量图像，经过优化以实现高效推理。

图像生成英语

Moondream 2b 2025 04 14 4bit

Moondream是一款轻量级视觉语言模型，专为高效全平台运行而设计。2025年4月14日发布的4比特量化版在保持高精度的同时大幅降低内存占用。

图像生成文本

GLM 4 32B 0414.w4a16 Gptq

这是一个使用GPTQ方法对GLM-4-32B-0414进行4位量化的模型，适用于消费级硬件。

大型语言模型

Falcon E 3B Base

Falcon-E是由TII开发的1.58比特量化语言模型，采用纯Transformer架构，专为高效推理设计

大型语言模型

Phi 4 Mini Instruct Float8dq

Phi-4-mini-instruct模型经torchao进行float8动态激活和权重量化，在H100上实现36%显存降低和15-20%速度提升，几乎不影响精度。

大型语言模型

Transformers 其他

Qwen2.5 VL 7B Instruct GPTQ Int4

Qwen2.5-VL-7B-Instruct-GPTQ-Int4是基于Qwen2.5-VL-7B-Instruct模型进行非官方GPTQ-Int4量化的版本，支持图文到文本的多模态任务。

图像生成文本

Transformers 支持多种语言

Deepseek R1 AWQ

DeepSeek R1的AWQ量化版本，由Eric Hartford和v2ray完成量化，修复了使用float16时的溢出问题。

大型语言模型

Transformers 支持多种语言

Llama 3 2 3B SFT GGUF

基于Llama-3.2-3B预训练模型的指令微调版本，采用4比特量化和LoRA技术进行高效微调

大型语言模型英语

Deepseek V3 AWQ

DeepSeek V3的AWQ量化版本，优化了float16使用时的溢出问题，适合在8张80GB GPU上使用vLLM进行高效服务。

大型语言模型

Transformers 支持多种语言

Flux.1 Lite是从FLUX.1-dev模型蒸馏而来的80亿参数Transformer模型，减少了7GB内存占用，运行速度提升23%，同时保持原始模型精度。

文本生成图像

Llama 3.2 3B Instruct FP8 Dynamic

Llama-3.2-3B-Instruct的FP8量化版本，适用于多语言的商业和研究用途，特别适合类似助手的聊天场景。

大型语言模型

Safetensors 支持多种语言

Llama 3.2 11B Vision Instruct FP8 Dynamic

这是一个基于Llama-3.2-11B-Vision-Instruct的量化模型，适用于多语言的商业和研究用途，可用于类似助手的聊天场景。

图像生成文本

Safetensors 支持多种语言

Pixtral 12b Nf4

基于Mistral社区Pixtral-12B的4位量化版本，专注于图像文本到文本任务，支持中文描述生成

图像生成文本

Madlad400 10b Mt Gguf

MADLAD-400-10B-MT 是一个多语言翻译模型，支持多种语言之间的翻译任务。

Taiwan Tinyllama V1.0 Chat

这是专为繁体中文优化的Tinyllama持续预训练版本，基于TinyLlama-1.1B模型，持续预训练数据集包含约20亿个词元。

大型语言模型

Transformers 中文

基于bigscience/bloom-1b7架构开发的中文语言模型，参数规模14亿，通过压缩词表降低显存占用

大型语言模型

Transformers 中文

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24