指令微调

# 指令微调

Gemma 3n E4B It GGUF

Gemma-3n-E4B-it 是 Google 发布的轻量级语言模型，基于 transformers 库，适用于图像文本转文本任务。

大型语言模型

Tencent.hunyuan A13B Instruct GGUF

腾讯混元A13B指令模型的量化版本，通过技术手段在保证性能的同时提升运行效率。

大型语言模型

Blake XTM Arc 3B V1 GGUF

Blake-XTM Arc 3B (V1) 是一个3B参数的指令大语言模型，基于microsoft/phi-2微调，支持文本生成、推理和工具调用。

大型语言模型英语

Gemma 3n E2B It Unsloth Bnb 4bit

Gemma 3n-E2B-it 是 Google 推出的轻量级开源多模态模型，基于与 Gemini 相同技术构建，专为低资源设备优化。

图像生成文本

Transformers 英语

Gryphe Codex 24B Small 3.2 GGUF

这是Gryphe的Codex-24B-Small-3.2模型的量化版本，通过量化技术优化了在不同硬件条件下的运行效率。

大型语言模型英语

Multilingual E5 Large Instruct GGUF

多语言e5大指令模型支持多种语言，在分类、检索、聚类等多项任务中表现出色，可广泛应用于各类自然语言处理场景。

大型语言模型支持多种语言

Gemma 3n E4B It

Gemma 3n是Google推出的轻量级、最先进的开源多模态模型家族，基于与Gemini模型相同的研究和技术构建，支持文本、音频和视觉输入。

图像生成文本

Fanar 1 9B Instruct

Fanar-1-9B-Instruct 是一款强大的阿拉伯语 - 英语大语言模型，由卡塔尔计算研究机构（QCRI）开发，支持现代标准阿拉伯语及多种阿拉伯方言，并与伊斯兰价值观和阿拉伯文化保持一致。

大型语言模型

Transformers 支持多种语言

Kakaocorp.kanana 1.5 8b Instruct 2505 GGUF

Kanana-1.5-8B-Instruct-2505 是由 Kakao Corp 开发的一个 8B 参数规模的指令微调语言模型，适用于文本生成任务。

大型语言模型

Marin Community.marin 8b Instruct GGUF

marin-8b-instruct 是一个 8B 参数规模的指令微调语言模型，适用于文本生成任务。

大型语言模型

Seed Coder 8B Instruct GGUF

Seed-Coder-8B-Instruct 是一款强大的开源代码模型，具有以模型为中心、透明和高性能等特点，在多种编码任务中表现出色。

大型语言模型

Qwen2.5 1.5B S1k 1.1

该模型是基于Qwen/Qwen2.5-1.5B-Instruct微调而来的文本生成模型，使用TRL进行训练，为文本生成任务提供了强大的支持。

大型语言模型

Spatial LLaVA 7B Gguf

Spatial-LLaVA-7B是基于LLaVA模型微调的多模态模型，专注于提升空间关系推理能力，适用于多模态研究和聊天机器人开发。

文本生成图像

Gryphe Pantheon Proto RP 1.8 30B A3B GGUF

这是一个基于Gryphe/Pantheon-Proto-RP-1.8-30B-A3B模型的量化版本，使用llama.cpp进行量化，适用于角色扮演和文本生成任务。

大型语言模型英语

Bielik 4.5B V3.0 Instruct FP8 Dynamic

该模型是Bielik-4.5B-v3.0-Instruct的FP8量化版本，通过AutoFP8技术将权重和激活量化为FP8数据类型，减少约50%的磁盘空间和GPU内存需求。

大型语言模型其他

Bielik 1.5B V3.0 Instruct FP8 Dynamic

这是一个基于Bielik-1.5B-v3.0-Instruct模型的FP8动态量化版本，适配vLLM或SGLang推理框架，通过AutoFP8量化技术将参数字节数从16位降至8位，显著降低磁盘空间和GPU显存需求。

大型语言模型其他

Bielik 1.5B V3.0 Instruct GGUF

这是一个波兰语的1.5B参数指令微调模型，基于SpeakLeash的Bielik系列开发，适用于文本生成任务。

大型语言模型其他

Allenai.olmo 2 0425 1B Instruct GGUF

OLMo-2-0425-1B-Instruct是由AllenAI开发的一个10亿参数规模的指令微调语言模型，专注于文本生成任务。

大型语言模型

Olmo 2 0425 1B Instruct GGUF

OLMo 2 1B指令版是基于OLMo-2-0425-1B-RLVR1模型的后训练变体，经过监督微调、DPO训练和RLVR训练，旨在实现多种任务的最先进性能。

大型语言模型英语

Smollm 135M Instruct

一个轻量级指令微调语言模型，专为移动端部署优化

大型语言模型

litert-community

Josiefied Qwen3 4B Abliterated V1 Gguf

这是 Josiefied-Qwen3-4B-abliterated-v1 模型的 GGUF 量化版本，适用于本地部署和运行。

大型语言模型

Goekdeniz-Guelmez

Olmo 2 0425 1B Instruct

OLMo 2 1B是基于allenai/OLMo-2-0425-1B-RLVR1模型的后训练变体，经过监督微调、DPO训练和RLVR训练，旨在实现多种任务的最先进性能。

大型语言模型

Transformers 英语

Industry Project V2

基于Mistral架构优化的指令微调模型，适用于零样本分类任务

大型语言模型

Stablelm Zephyr 3b GGUF

StableLM Zephyr 3B是一个30亿参数的指令调优模型，基于公开数据集、合成数据集和直接偏好优化(DPO)训练，性能表现优异。

大型语言模型英语

Gemma 2 9b It Abliterated GGUF

基于Gemma 2.9B的量化版本，使用llama.cpp进行优化，适合在LM Studio中运行。

大型语言模型英语

Aya-23是一个开放权重的指令微调模型研究版本，具有高度先进的多语言能力，支持23种语言。

大型语言模型

Transformers 支持多种语言

Llama Krikri 8B Instruct

Llama-Krikri-8B-Instruct是由雅典娜研究中心开发的希腊语指令调优大语言模型，基于Llama-3.1-8B构建，增强了希腊语和英语的多任务处理能力。

大型语言模型

Transformers 支持多种语言

Badger Writer Llama 3 8b

Badger Writer 是基于多个 Llama 3 8B 模型的归一化傅里叶任务叠加模型，专注于文本生成任务，特别擅长创意写作和指令跟随。

大型语言模型

MKLLM 7B Instruct

MKLLM-7B是一款面向马其顿语的开源大语言模型，基于Mistral-7B-v0.1模型通过持续预训练马其顿语和英语混合文本构建而成。

大型语言模型

Transformers 支持多种语言

Gemma 2 Llama Swallow 27b It V0.1

基于Gemma-2架构的日语增强大语言模型，通过持续预训练显著提升日语能力，同时保留原版英语能力

大型语言模型

Transformers 支持多种语言

Gemma 2 Llama Swallow 9b It V0.1

Gemma-2-Llama-Swallow系列模型是在Gemma-2基础上进行持续预训练构建的多语言大模型，特别增强了日语能力。

大型语言模型

Transformers 支持多种语言

Gemma 2 Llama Swallow 2b It V0.1

Gemma-2-Llama-Swallow系列是通过对gemma-2模型进行持续预训练构建的，显著增强了日文语言处理能力，同时保留原有英文能力。

大型语言模型

Transformers 支持多种语言

Turkish Gemma 9b V0.1

Turkish-Gemma-9b-v0.1是基于Gemma-2-9b开发的土耳其语文本生成模型，通过持续预训练、监督微调（SFT）、直接偏好优化（DPO）和模型合并技术优化而成。

大型语言模型

Bielik 4.5B V3.0 Instruct

Bielik-4.5B-v3-Instruct是一款拥有46亿参数的波兰语生成式文本模型，基于Bielik-4.5B-v3进行指令微调，展现出卓越的波兰语理解和处理能力。

大型语言模型

Transformers 其他

OLMo 2 1B是艾伦人工智能研究所推出的开放语言模型系列中最小的模型，基于OLMo-mix-1124预训练，并在中期训练阶段使用Dolmino-mix-1124数据集。

大型语言模型

Transformers 英语

Falcon E 1B Instruct

Falcon-E-1B-Instruct 是一个基于1.58比特架构的高效语言模型，专为边缘设备优化，具有低内存占用和高性能的特点。

大型语言模型

Qwen2.5 Recursive Coder 14B Instruct

基于Qwen2.5架构的14B参数规模代码生成与理解模型，通过Model Stock方法融合多个专业编码模型而成

大型语言模型

Videochat R1 Thinking 7B

VideoChat-R1-thinking_7B 是一个基于 Qwen2.5-VL-7B-Instruct 的多模态模型，专注于视频文本转文本任务。

视频生成文本

Transformers 英语

Multilingual E5 Large Instruct Q8 0 GGUF

多语言E5大型指令模型，支持多种语言的文本嵌入和分类任务，具有强大的跨语言能力。

大型语言模型支持多种语言

R01 Gemma 3 1b It

Gemma 3是谷歌推出的轻量级开源多模态模型，基于与Gemini相同技术构建，支持文本和图像输入并生成文本输出。

文本生成图像

Transformers 英语

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24