低参高效

# 低参高效

Qwen3 0.6B GGUF

Qwen3-0.6B 是 Qwen 系列最新一代的 0.6B 参数规模的大语言模型，支持思维和非思维模式切换，具备强大的推理、指令遵循和多语言能力。

大型语言模型

Qwen3 1.7B GGUF

通义千问系列大语言模型的最新版本，支持思维与非思维模式切换，具备强大的推理、多语言和智能体能力。

大型语言模型

Falcon H1 0.5B Instruct

猎鹰-H1是由TII开发的混合Transformers+Mamba架构的因果解码器专用语言模型，支持英语，性能卓越。

大型语言模型

Qwen3 1.7B Unsloth Bnb 4bit

Qwen3-1.7B是通义千问系列最新一代大语言模型中的17亿参数版本，支持思维模式切换、多语言处理和智能体能力。

大型语言模型

Transformers 英语

Qwen3-0.6B是通义千问系列最新一代0.6B参数规模的大语言模型，支持思维与非思维模式切换，具备强大的推理、指令遵循和智能体能力。

大型语言模型

Openmath Nemotron 1.5B

OpenMath-Nemotron-1.5B是基于Qwen2.5-Math-1.5B在OpenMathReasoning数据集上微调的数学推理模型，在多个数学基准测试中取得最先进结果。

大型语言模型

Transformers 英语

Colqwenstella 2b Multilingual

基于Qwen2视觉模型与stella_en_1.5B_v5结合的多语言视觉检索器，在Vidore基准测试中参数量≤20亿的模型中排名第一

文本生成图像支持多种语言

Conversation Summarizer V2

基于微调的 Llama 3.2 (3B) 的对话摘要模型，专门用于生成对话的简洁摘要。

文本生成英语

Llama 3.2 3B Instruct Frog

专为越南语优化的RAG版LLaMA3.2模型，基于Meta的轻量级LLM开发，适合本地和边缘设备部署。

大型语言模型

Safetensors 支持多种语言

Xinyuan-VL-2B 是赛灵格集团推出的面向终端侧的高性能多模态大模型，基于 Qwen/Qwen2-VL-2B-Instruct 微调而成，使用了超过500万条多模态数据及少量纯文本数据。

文本生成图像

Transformers 支持多种语言

Llava Phi 3 Mini 4k Instruct

结合Phi-3-mini-3.8B大语言模型与LLaVA v1.5的视觉语言模型，提供先进的视觉语言理解能力。

图像生成文本

ConvAI-9b是一个拥有90亿参数的对话式AI模型，基于Zephyr-7b-beta和Mistral-7B-v0.2融合构建，适用于聊天机器人、虚拟助手等交互场景。

大型语言模型

Transformers 英语

CreitinGameplays

Towerinstruct Mistral 7B V0.2

基于Mistral架构的70亿参数多语言翻译模型，支持10种语言的翻译相关任务

大型语言模型

Transformers 支持多种语言

Codegemma 2b GGUF

CodeGemma是基于Gemma构建的轻量级开源代码模型系列，包含文本到文本和文本到代码的解码器模型，专精代码补全与生成任务。

大型语言模型

Minicpm 2B Dpo Bf16

MiniCPM是由面壁智能与清华大学自然语言处理实验室联合开源的一系列端侧大语言模型，核心语言模型MiniCPM-2B仅含24亿非词嵌入参数。

大型语言模型

Transformers 支持多种语言

Proctora是基于混合专家架构(MoE)的模型，结合了角色扮演和事实性回答的专家模块，支持32K上下文长度，在AI-RPG评估中表现优异。

大型语言模型

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24