量化优化

# 量化优化

Huihui Ai.magistral Small 2506 Abliterated GGUF

慧慧AI量化模型是Magistral-Small-2506-abliterated的量化版本，致力于让知识为每个人所用。

大型语言模型

Nomic Embed Code I1 GGUF

基于nomic-ai/nomic-embed-code基础模型的量化版本，提供多种量化选项，适用于代码嵌入和特征提取任务。

Transformers 英语

Servicenow AI Apriel Nemotron 15b Thinker GGUF

这是一个由ServiceNow语言模型（SLAM）实验室构建的15B参数大语言模型，经过llama.cpp工具量化处理，适用于本地推理部署。

大型语言模型

Gemma 2 9b It Abliterated GGUF

基于Gemma 2.9B的量化版本，使用llama.cpp进行优化，适合在LM Studio中运行。

大型语言模型英语

Illustrious XL V2.0 GGUF

Illustrious-XL-v2.0 是一个文本生成图像的基础模型，适用于多种图像生成任务。

Gemma 3 12B It Qat GGUF

Gemma 3 12B IT是由谷歌开发的大语言模型，支持多模态输入和长上下文处理。

图像生成文本

lmstudio-community

Elastic Llama 3.1 8B Instruct

Meta-Llama-3.1-8B-Instruct 的弹性优化版本，提供不同速度与精度的模型变体，适合自部署场景。

大型语言模型

Qwen Ai Research Qa Q4 K M.gguf

专为回答研究型人工智能问题设计的问答模型，采用Q4_K_M量化格式优化，在保持高质量响应的同时实现高效推理。

大型语言模型英语

Llava 1.6 Mistral 7b Gguf

LLaVA是一个开源的多模态聊天机器人，通过在多模态指令跟随数据上微调LLM训练而成。本版本为GGUF量化版本，提供多种量化选项。

文本生成图像

Multilingual E5 Small Optimized

这是multilingual-e5-small的量化版本，通过逐层量化优化了推理性能，同时保持了原始模型的大部分质量。

文本嵌入支持多种语言

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24