低显存需求

# 低显存需求

Nunchaku Flux.1 Dev

Nunchaku 量化的 FLUX.1-dev 模型，用于根据文本提示生成高质量图像，优化了推理效率。

图像生成英语

Deepseek R1 0528 FP4

DeepSeek AI 公司的 DeepSeek R1 0528 模型的量化版本，基于优化的 Transformer 架构的自回归语言模型，可用于商业和非商业用途。

大型语言模型

Deepseek R1 0528 Quantized.w4a16

经过量化处理的DeepSeek-R1-0528模型，通过将权重量化为INT4数据类型，显著降低了GPU内存和磁盘空间的需求。

大型语言模型

Wan2.1 VACE 1.3B

Wan2.1是一套开放且先进的视频生成基础模型，支持多种视频生成和编辑任务。

文本生成视频支持多种语言

Stable Diffusion 3.5 Large DF11

采用DFloat11格式对stabilityai/stable-diffusion-3.5-large进行无损压缩的版本，体积缩减30%，精度保持100%

Qwen3 32B Quantized.w4a16

Qwen3-32B的INT4量化版本，通过权重量化减少75%的磁盘和GPU内存需求，保持高性能

大型语言模型

Qwen3 14B FP8 Dynamic

Qwen3-14B-FP8-dynamic 是一个经过优化的大语言模型，通过将激活值和权重量化为 FP8 数据类型，有效降低了 GPU 内存需求，提高了计算吞吐量。

大型语言模型

Qwen3 8B FP8 Dynamic

Qwen3-8B-FP8-dynamic是基于Qwen3-8B模型通过FP8量化优化的版本，显著降低了GPU内存需求和磁盘空间占用，同时保持了原始模型的性能。

大型语言模型

万2.1是一个开放且先进的大规模视频生成模型，具备顶尖性能，支持消费级GPU运行，并在多任务处理中表现卓越。

文本生成视频支持多种语言

Deepseek R1 Quantized.w4a16

DeepSeek-R1的INT4权重量化版本，通过减少权重位数降低GPU内存和磁盘空间需求约50%，保持原始模型性能。

大型语言模型

Deepcoder 14B Preview Exl2

DeepCoder-14B-Preview是基于DeepSeek-R1-Distill-Qwen-14B开发的代码生成模型，专注于可验证编程问题的解决。

大型语言模型英语

Hidream I1 Fast Nf4

HiDream-I1是拥有170亿参数的开源图像生成基础模型，4比特量化版本可在16GB显存下运行，实现快速高质量的图像生成。

Wan2.1 I2V 14B 720P Diffusers

万2.1是一套全面开放的视频基础模型，具有顶尖性能，支持消费级GPU，多任务支持，视觉文本生成和高效视频VAE。

视频处理支持多种语言

万2.1版是一个开放且先进的大规模视频生成模型，支持文本生成视频、图像生成视频等多种任务，适配消费级显卡。

文本生成视频支持多种语言

Wan2.1 T2V 1.3B

万2.1是一套全面开放的视频基础模型，旨在突破视频生成的边界，支持中英双语文本生成视频、图像生成视频等多种任务。

文本生成视频支持多种语言

Mistral Small 24B Instruct 2501 GPTQ G128 W4A16 MSE

这是mistralai/Mistral-Small-24B-Instruct-2501模型的4位量化版本，由ConfidentialMind.com量化，实现了更小、更快的模型，同时性能损失极小。

大型语言模型英语

ConfidentialMind

Lumina的GGUF量化版本是一个专为生成优质图像而设计的模型，支持基于文本提示生成高匹配度的图像。

Deepseek R1 Distill Qwen 32B Quantized.w8a8

DeepSeek-R1-Distill-Qwen-32B的量化版本，通过INT8权重量化和激活量化减少内存需求并提高计算效率

大型语言模型

Deepseek R1 Distill Llama 70B FP8 Dynamic

DeepSeek-R1-Distill-Llama-70B的FP8量化版本，通过减少权重和激活的位数来优化推理性能

大型语言模型

基于PixArt-alpha/PixArt-XL-2-1024-MS的量化版本，支持高效文生图任务

图像生成英语

Svdq Int4 Flux.1 Schnell

FLUX.1-schnell的INT4量化版本，基于SVDQuant技术实现高效文本生成图像

文本生成图像英语

Sd3.5 Medium Gguf

Stable Diffusion 3.5 Medium的GGUF量化版本，适用于文生图任务，支持在老旧设备上运行。

图像生成英语

Sd3.5 Large Turbo

Stable Diffusion 3.5 Large Turbo的GGUF量化版本，适用于图像生成任务，提供更高效的运行性能。

文本生成图像英语

Molmo 7B D Bnb 4bit

Molmo-7B-D是一个经过BnB 4bit量化的大语言模型，模型体积从30GB减小到7GB，显存需求降低至约12GB。

大型语言模型

Llama 3.2 1B Instruct FP8

Llama-3.2-1B-Instruct的FP8量化版本，适用于多语言场景的商业和研究用途，性能接近原始模型。

大型语言模型

Safetensors 支持多种语言

Molmo 7B O Bnb 4bit

Molmo-7B-O的4bit量化版本，显著降低显存需求，适合资源有限的环境。

大型语言模型

这是一个结合了Hands XL、SD 1.5和FLUX.1-dev技术的文本生成图像模型，专注于高质量图像生成。

Llama 3.1 8B Instruct FP8

Meta Llama 3.1 8B Instruct模型的FP8量化版本，采用优化的transformer架构的自回归语言模型，支持128K上下文长度。

大型语言模型

FLUX.1 Dev Qint4

FLUX.1-dev 是一个文本生成图像的模型，已使用 Optimum Quanto 量化为 INT4 格式，适用于非商业用途。

文本生成图像英语

Meta Llama 3.1 70B Instruct Quantized.w8a8

这是Meta-Llama-3.1-70B-Instruct的量化版本，通过INT8权重量化降低GPU内存需求和磁盘空间，同时提高计算吞吐量，适用于多语言商业和研究场景。

大型语言模型

Transformers 支持多种语言

Meta Llama 3.1 8B Instruct Quantized.w4a16

Meta-Llama-3.1-8B-Instruct的量化版本，经过优化减少磁盘空间和GPU内存需求，适用于英文商业和研究用途的聊天助手场景。

大型语言模型

Transformers 支持多种语言

Meta Llama 3.1 8B Instruct GPTQ INT4

这是Meta-Llama-3.1-8B-Instruct模型的INT4量化版本，使用GPTQ算法进行量化，适用于多语言对话场景。

大型语言模型

Transformers 支持多种语言

Meta Llama 3.1 405B Instruct FP8 Dynamic

Meta-Llama-3.1-405B-Instruct的FP8量化版本，适用于多语言的商业和研究用途，特别优化用于助手机器人场景。

大型语言模型

Transformers 支持多种语言

Meta Llama 3.1 8B Instruct FP8

Meta-Llama-3.1-8B-Instruct的FP8量化版本，适用于多语言的商业和研究用途，特别优化用于类似助手的聊天场景。

大型语言模型

Transformers 支持多种语言

Deepseek Coder V2 Lite Instruct FP8

DeepSeek-Coder-V2-Lite-Instruct的FP8量化版本，适用于英语的商业和研究用途，优化了推理效率。

大型语言模型

Meta Llama 3 70B Instruct Quantized.w8a16

Meta-Llama-3-70B-Instruct 的量化版本，主要用于英文的商业和研究用途，能高效地进行类助手聊天。

大型语言模型

Transformers 英语

MaPO是一种无需参考样本、高效节能且内存友好的文生图扩散模型对齐方法

文本生成图像

Koala Lightning 700m

KOALA-Lightning-700M是基于SDXL-Lightning通过知识蒸馏训练的高效文本生成图像模型，在保持生成质量的同时显著提升推理速度

Koala Lightning 1b

KOALA-Lightning-1B是基于SDXL-Lightning的知识蒸馏模型，通过压缩U-Net结构实现高效文本生成图像，参数规模1.16B

文本生成图像

Psyfighter2 13B Vore GGUF

这是Psyfighter2-13B-vore模型的量化版本，专为故事写作、聊天对话和文字冒险游戏优化。

大型语言模型英语

SnakyMcSnekFace

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24