低内存优化

# 低内存优化

LGAI EXAONE EXAONE 4.0 1.2B GGUF

EXAONE-4.0-1.2B是LGAI-EXAONE发布的1.2B参数语言模型，提供多种量化版本以适应不同硬件需求。

大型语言模型

LGAI EXAONE EXAONE 4.0 32B GGUF

LGAI-EXAONE的EXAONE-4.0-32B模型的量化版本，使用llama.cpp工具进行量化处理，旨在为不同硬件条件的用户提供更灵活的使用选择。

大型语言模型

Menlo Lucy GGUF

Lucy模型是Menlo公司开发的大语言模型，经过量化处理后能在保证性能的同时减少资源需求，提升运行效率。

大型语言模型

Google Medgemma 4b It GGUF

这是Google的medgemma-4b-it模型的Llamacpp imatrix量化版本，提供了多种量化选项，适用于不同需求的用户。

大型语言模型

Thedrummer Snowpiercer 15B V2 GGUF

这是TheDrummer的Snowpiercer-15B-v2模型的量化版本，使用llama.cpp工具进行量化处理，提供多种量化类型以满足不同性能和质量需求。

大型语言模型

Huihui Ai Huihui Gemma 3n E4B It Abliterated GGUF

Huihui-gemma-3n-E4B-it-abliterated是huihui-ai团队开发的基于Gemma架构的文本生成模型，提供多种量化版本以适应不同硬件需求。

大型语言模型

Pinkpixel Crystal Think V2 GGUF

这是一个对PinkPixel的Crystal-Think-V2模型进行的量化处理版本，提供多种量化类型以满足不同硬件和性能需求。

大型语言模型英语

Gryphe Codex 24B Small 3.2 GGUF

这是Gryphe的Codex-24B-Small-3.2模型的量化版本，通过量化技术优化了在不同硬件条件下的运行效率。

大型语言模型英语

Mistralai Mistral Small 3.2 24B Instruct 2506 GGUF

这是Mistral-Small-3.2-24B-Instruct-2506模型的Llamacpp imatrix量化版本，提供多种量化类型以满足不同硬件需求。

大型语言模型支持多种语言

Menlo Jan Nano GGUF

基于llama.cpp对Menlo/Jan - nano模型进行量化处理，提供多种量化类型的模型文件，以满足不同硬件和性能需求。

大型语言模型

Cognitivecomputations Qwen3 72B Embiggened GGUF

基于cognitivecomputations/Qwen3-72B-Embiggened模型的量化版本，使用llama.cpp进行量化处理，可在多种环境下高效运行。

大型语言模型

BAAI RoboBrain2.0 7B GGUF

这是BAAI的RoboBrain2.0-7B模型的量化版本，通过llama.cpp进行量化处理，提供多种量化类型以适应不同硬件需求。

大型语言模型

Akhil Theerthala Kuvera 8B V0.1.0 GGUF

Kuvera-8B是一个专注于金融和个人理财领域的8B参数大语言模型，提供多种量化版本以适应不同硬件需求。

大型语言模型英语

Xlangai Jedi 7B 1080p GGUF

这是一个使用llama.cpp进行量化的Jedi - 7B - 1080p模型，提供了多种量化类型供用户选择，以平衡文件大小和模型质量。

大型语言模型英语

E N V Y Legion V2.1 LLaMa 70B Elarablated V0.8 Hf GGUF

Legion-V2.1-LLaMa-70B-Elarablated-v0.8-hf是基于LLaMa-70B的量化版本，采用llama.cpp进行优化，提供多种量化选项以适应不同硬件需求。

大型语言模型

Nvidia Llama 3.1 Nemotron Nano 4B V1.1 GGUF

基于NVIDIA Llama-3.1-Nemotron-Nano-4B-v1.1模型的量化版本，使用llama.cpp工具进行多种量化处理，适合在资源受限的环境中运行。

大型语言模型英语

Qwen2.5 Omni 7B GPTQ Int4

Qwen2.5-Omni 是一个端到端的多模态模型，能够感知文本、图像、音频和视频等多种模态，并以流式方式生成文本和自然语音响应。

多模态融合

Transformers 英语

Gemma 3 12B FornaxV.2 QAT CoT Q4 0 GGUF

这是一个实验性的小型思维模型，旨在8GiB消费级显卡上运行，具备通用推理能力。通过监督微调（SFT）和高质量推理轨迹训练，模型能够将推理能力泛化至多种任务。

大型语言模型

Huihui Ai Qwen3 14B Abliterated GGUF

Qwen3-14B-abliterated是基于Qwen3-14B模型的量化版本，使用llama.cpp进行优化，提供多种量化选项以适应不同性能需求。

大型语言模型

Qwen Qwen3 32B GGUF

基于Qwen/Qwen3-32B的量化版本，使用llama.cpp进行量化，支持多种量化类型，适用于不同硬件需求。

大型语言模型

Qwen Qwen3 1.7B GGUF

基于Qwen/Qwen3-1.7B的量化版本，使用llama.cpp进行量化，支持多种量化类型，适用于文本生成任务。

大型语言模型

Qwen Qwen3 4B GGUF

Qwen团队提供的Qwen3-4B的Llamacpp imatrix量化版本，支持多种量化类型，适用于文本生成任务。

大型语言模型

Qwen Qwen3 30B A3B GGUF

基于Qwen/Qwen3-30B-A3B的量化版本，使用llama.cpp进行多种精度量化，适用于文本生成任务。

大型语言模型

Llama 3.2 1B Instruct GGUF

Llama-3.2-1B-Instruct 是一个基于 Llama 架构的 1B 参数量的指令微调模型，提供多种量化格式以适应不同硬件需求。

大型语言模型支持多种语言

Tesslate Tessa Rust T1 7B GGUF

Tessa-Rust-T1-7B的量化版本，使用llama.cpp工具进行量化处理，支持在不同硬件条件下高效运行。

大型语言模型

Transformers 英语

Vicoder Html 32B Preview GGUF

ViCoder-HTML-32B-preview是一款强大的AI模型，专为生成完整网站而设计，包括HTML、Tailwind CSS和JavaScript代码。

大型语言模型其他

Abomimegadarkgasinalgottenevereamession

这是一个基于DARE TIES方法合并的12B参数语言模型，融合了多个预训练模型，旨在提供强大的文本生成能力。

大型语言模型

Qwen2.5 72B Instruct GGUF

Qwen2.5-72B-Instruct的GGUF量化版本，支持多种精度格式，适用于不同硬件环境的高效推理。

大型语言模型英语

Llama 2 7b Chat Hf GGUF

Llama 2是由Meta开发的7B参数规模的大语言模型，提供多种量化版本以适应不同硬件需求。

大型语言模型英语

Mxbai Rerank Large V2 GGUF

mxbai-rerank-large-v2是一个多语言文本重排序模型，支持多种语言和多种量化格式，适用于不同硬件环境。

文本嵌入支持多种语言

phi-4是微软研究院开发的开源语言模型，专注于高质量数据和推理能力，适用于内存/计算受限环境。

大型语言模型支持多种语言

Meta Llama 3 8B GGUF

Meta-Llama-3-8B 是一个基于 GGUF 格式的 8B 参数大语言模型，支持多种量化版本，适用于不同硬件环境。

大型语言模型英语

RWKV7 Goose World3 2.9B HF GGUF

基于flash-linear attention格式的RWKV-7模型，支持多语言文本生成任务。

大型语言模型支持多种语言

Rwkv7 2.9B World GGUF

RWKV-7架构的29亿参数大语言模型，支持多语言文本生成任务

大型语言模型支持多种语言

这是一个基于Wan-AI/Wan2.1-T2V-1.3B的gguf量化版本，专为文本生成视频任务设计，兼容comfyui-gguf和gguf节点。

文本生成视频英语

Thedrummer Cydonia 24B V2.1 GGUF

Cydonia-24B-v2.1是一个24B参数的大语言模型，经过llama.cpp的imatrix量化处理，提供多种量化版本以适应不同硬件需求。

大型语言模型

Rombo Org Rombo LLM V3.1 QWQ 32b GGUF

Rombo-LLM-V3.1-QWQ-32b是一个32B参数规模的大型语言模型，经过llama.cpp的imatrix量化处理，提供多种量化版本以适应不同硬件需求。

大型语言模型

mochi的gguf量化版本是一个文本生成视频的模型，包含gguf编码器和gguf变分自编码器，适用于快速生成视频内容。

文本生成视频英语

Thedrummer Cydonia 24B V2 GGUF

这是一个24B参数的大语言模型，经过llama.cpp的imatrix量化处理，提供多种量化版本以适应不同硬件需求。

大型语言模型

Zed Industries Zeta GGUF

这是对zed-industries的zeta模型进行的Llamacpp imatrix量化版本，解决了在不同硬件条件下高效运行模型的问题，提供了多种量化类型供用户选择。

大型语言模型

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24