低内存消耗

# 低内存消耗

Apriel Nemotron 15b Thinker GGUF

Apriel-Nemotron-15b-Thinker是一款强大的推理模型，在同规模模型中表现出色，具有高效的内存使用和优秀的推理能力，适用于多种企业和学术场景。

大型语言模型

FLUX.1 Dev ControlNet Union Pro 2.0 Fp8

这是Shakker-Labs/FLUX.1-dev-ControlNet-Union-Pro-2.0模型的FP8量化版本，通过PyTorch原生FP8支持从原始BFloat16格式量化而来，优化了推理性能。

图像生成英语

Sonics Spectttra Alpha 120s

用于端到端合成歌曲检测的先进模型，能够识别AI生成的完整歌曲（包括人声、音乐、歌词和风格）

Deepseek R1 Distill Qwen 1.5B

基于DeepSeek-R1-Distill-Qwen-1.5B的多个变体，适配LiteRT框架和MediaPipe LLM推理API，可部署于Android平台。

大型语言模型

litert-community

Llama 3.2 3B Instruct Unsloth Bnb 4bit

基于Meta Llama 3.2-3B-Instruct模型，采用Unsloth动态4位量化技术优化的高效大语言模型

大型语言模型

Transformers 英语

Modernbert Large Zeroshot V2.0

基于ModernBERT-large微调的零样本分类器，高效快速且内存占用低，适用于多种文本分类任务。

大型语言模型

Mms 300m 1130 Forced Aligner

基于Hugging Face预训练模型的文本与音频强制对齐工具，支持多种语言，内存效率高

Transformers 支持多种语言

Google Gemma 2b AWQ 4bit Smashed

基于google/gemma-2b模型通过AWQ技术压缩的4位量化版本，旨在提升推理效率并降低资源消耗。

大型语言模型

Universal NER UniNER 7B All Bnb 4bit Smashed

PrunaAI提供的压缩版UniNER-7B-all模型，通过量化技术显著减少内存占用和能耗，同时保持较好的命名实体识别能力。

大型语言模型

Writer Palmyra Small Bnb 8bit Smashed

PrunaAI优化的8位量化版Palmyra小型语言模型，显著降低内存占用和能耗

大型语言模型

Mosaicml Mpt 7b Storywriter Bnb 4bit Smashed

PrunaAI压缩的MPT-7B故事写作模型，通过llm-int8技术实现高效推理

大型语言模型

Transformers 其他

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24