指令微调
Kakaocorp.kanana 1.5 8b Instruct 2505 GGUF
Kanana-1.5-8B-Instruct-2505 是由 Kakao Corp 开发的一个 8B 参数规模的指令微调语言模型,适用于文本生成任务。
大型语言模型
K
DevQuasar
483
1
Marin Community.marin 8b Instruct GGUF
marin-8b-instruct 是一个 8B 参数规模的指令微调语言模型,适用于文本生成任务。
大型语言模型
M
DevQuasar
343
1
Gryphe Pantheon Proto RP 1.8 30B A3B GGUF
Apache-2.0
这是一个基于Gryphe/Pantheon-Proto-RP-1.8-30B-A3B模型的量化版本,使用llama.cpp进行量化,适用于角色扮演和文本生成任务。
大型语言模型
英语
G
bartowski
2,972
6
Bielik 4.5B V3.0 Instruct FP8 Dynamic
Apache-2.0
该模型是Bielik-4.5B-v3.0-Instruct的FP8量化版本,通过AutoFP8技术将权重和激活量化为FP8数据类型,减少约50%的磁盘空间和GPU内存需求。
大型语言模型
其他
B
speakleash
74
1
Bielik 1.5B V3.0 Instruct FP8 Dynamic
Apache-2.0
这是一个基于Bielik-1.5B-v3.0-Instruct模型的FP8动态量化版本,适配vLLM或SGLang推理框架,通过AutoFP8量化技术将参数字节数从16位降至8位,显著降低磁盘空间和GPU显存需求。
大型语言模型
其他
B
speakleash
31
1
Bielik 1.5B V3.0 Instruct GGUF
Apache-2.0
这是一个波兰语的1.5B参数指令微调模型,基于SpeakLeash的Bielik系列开发,适用于文本生成任务。
大型语言模型
其他
B
speakleash
341
3
Allenai.olmo 2 0425 1B Instruct GGUF
OLMo-2-0425-1B-Instruct是由AllenAI开发的一个10亿参数规模的指令微调语言模型,专注于文本生成任务。
大型语言模型
A
DevQuasar
220
1
Olmo 2 0425 1B Instruct GGUF
Apache-2.0
OLMo 2 1B指令版是基于OLMo-2-0425-1B-RLVR1模型的后训练变体,经过监督微调、DPO训练和RLVR训练,旨在实现多种任务的最先进性能。
大型语言模型
英语
O
unsloth
3,137
3
Josiefied Qwen3 4B Abliterated V1 Gguf
Apache-2.0
这是 Josiefied-Qwen3-4B-abliterated-v1 模型的 GGUF 量化版本,适用于本地部署和运行。
大型语言模型
J
Goekdeniz-Guelmez
4,518
7
Olmo 2 0425 1B Instruct
Apache-2.0
OLMo 2 1B是基于allenai/OLMo-2-0425-1B-RLVR1模型的后训练变体,经过监督微调、DPO训练和RLVR训练,旨在实现多种任务的最先进性能。
大型语言模型
Transformers
英语
O
allenai
5,127
33
Industry Project V2
Apache-2.0
基于Mistral架构优化的指令微调模型,适用于零样本分类任务
大型语言模型
I
omsh97
58
0
Stablelm Zephyr 3b GGUF
其他
StableLM Zephyr 3B是一个30亿参数的指令调优模型,基于公开数据集、合成数据集和直接偏好优化(DPO)训练,性能表现优异。
大型语言模型
英语
S
brittlewis12
51
1
Gemma 2 9b It Abliterated GGUF
基于Gemma 2.9B的量化版本,使用llama.cpp进行优化,适合在LM Studio中运行。
大型语言模型
英语
G
bartowski
3,941
37
Aya 23 8B
Aya-23是一个开放权重的指令微调模型研究版本,具有高度先进的多语言能力,支持23种语言。
大型语言模型
Transformers
支持多种语言
A
CohereLabs
10.28k
415
Llama Krikri 8B Instruct
Llama-Krikri-8B-Instruct是由雅典娜研究中心开发的希腊语指令调优大语言模型,基于Llama-3.1-8B构建,增强了希腊语和英语的多任务处理能力。
大型语言模型
Transformers
支持多种语言
L
ilsp
1,630
18
Badger Writer Llama 3 8b
Badger Writer 是基于多个 Llama 3 8B 模型的归一化傅里叶任务叠加模型,专注于文本生成任务,特别擅长创意写作和指令跟随。
大型语言模型
Transformers
B
maldv
106
10
MKLLM 7B Instruct
MKLLM-7B是一款面向马其顿语的开源大语言模型,基于Mistral-7B-v0.1模型通过持续预训练马其顿语和英语混合文本构建而成。
大型语言模型
Transformers
支持多种语言
M
trajkovnikola
31
8
Gemma 2 Llama Swallow 27b It V0.1
基于Gemma-2架构的日语增强大语言模型,通过持续预训练显著提升日语能力,同时保留原版英语能力
大型语言模型
Transformers
支持多种语言
G
tokyotech-llm
27
1
Gemma 2 Llama Swallow 2b It V0.1
Gemma-2-Llama-Swallow系列是通过对gemma-2模型进行持续预训练构建的,显著增强了日文语言处理能力,同时保留原有英文能力。
大型语言模型
Transformers
支持多种语言
G
tokyotech-llm
61
1
Turkish Gemma 9b V0.1
Turkish-Gemma-9b-v0.1是基于Gemma-2-9b开发的土耳其语文本生成模型,通过持续预训练、监督微调(SFT)、直接偏好优化(DPO)和模型合并技术优化而成。
大型语言模型
Safetensors
T
ytu-ce-cosmos
167
18
Bielik 4.5B V3.0 Instruct
Apache-2.0
Bielik-4.5B-v3-Instruct是一款拥有46亿参数的波兰语生成式文本模型,基于Bielik-4.5B-v3进行指令微调,展现出卓越的波兰语理解和处理能力。
大型语言模型
Transformers
其他
B
speakleash
1,121
13
Olmo 2 0425 1B
Apache-2.0
OLMo 2 1B是艾伦人工智能研究所推出的开放语言模型系列中最小的模型,基于OLMo-mix-1124预训练,并在中期训练阶段使用Dolmino-mix-1124数据集。
大型语言模型
Transformers
英语
O
allenai
13.31k
45
Falcon E 1B Instruct
其他
Falcon-E-1B-Instruct 是一个基于1.58比特架构的高效语言模型,专为边缘设备优化,具有低内存占用和高性能的特点。
大型语言模型
Transformers
F
tiiuae
87
7
Qwen2.5 Recursive Coder 14B Instruct
Apache-2.0
基于Qwen2.5架构的14B参数规模代码生成与理解模型,通过Model Stock方法融合多个专业编码模型而成
大型语言模型
Transformers
Q
spacematt
39
2
Videochat R1 Thinking 7B
Apache-2.0
VideoChat-R1-thinking_7B 是一个基于 Qwen2.5-VL-7B-Instruct 的多模态模型,专注于视频文本转文本任务。
视频生成文本
Transformers
英语
V
OpenGVLab
800
0
Multilingual E5 Large Instruct Q8 0 GGUF
MIT
多语言E5大型指令模型,支持多种语言的文本嵌入和分类任务,具有强大的跨语言能力。
大型语言模型
支持多种语言
M
Gomez12
90
1
R01 Gemma 3 1b It
Gemma 3是谷歌推出的轻量级开源多模态模型,基于与Gemini相同技术构建,支持文本和图像输入并生成文本输出。
文本生成图像
Transformers
英语
R
EpistemeAI
17
1
Latxa Llama 3.1 70B Instruct FP8
Latxa是基于Llama-3.1的70B参数巴斯克语大语言模型,经过指令微调和FP8量化,专为巴斯克语优化设计
大型语言模型
Transformers
L
HiTZ
988
1
MT Gen10 Gemma 2 9B
这是一个基于Gemma-2-9B系列模型通过DARE TIES方法合并的多模型融合版本,整合了多个Gemma变体的优势。
大型语言模型
Transformers
M
zelk12
26
2
Qwen2.5 1.5B Instruct
Apache-2.0
专为Gensyn RL Swarm设计的1.5B参数指令微调模型,支持通过点对点强化学习进行本地微调
大型语言模型
Transformers
英语
Q
Gensyn
2.1M
4
Zhaav Gemma3 4B
基于Gemma 3架构微调的波斯语专用模型,使用QLoRA 4位量化技术,适合普通硬件运行。
大型语言模型
其他
Z
alifzl
40
1
Gemma 3 1b It Llamafile
Gemma是Google推出的轻量级开放模型系列,基于与Gemini相同的研究技术构建。
文本生成图像
G
Mozilla
469
3
Latxa Llama 3.1 70B Instruct
Latxa 3.1 70B Instruct是基于Llama-3.1 (Instruct)的指令调优版,专为巴斯克语优化,在多项巴斯克语基准测试上表现优异。
大型语言模型
Transformers
支持多种语言
L
HiTZ
59
3
Toastypigeon Gemma 3 Starshine 12B GGUF
基于Gemma 3 12B的创意写作模型,擅长叙事与场景构建,文风偏向小说化
大型语言模型
英语
T
ArtusDev
223
2
Gams 9B Instruct GGUF
GaMS-9B-Instruct是基于Google Gemma 2系列开发的斯洛文尼亚语大语言模型,支持斯洛文尼亚语、英语及部分南斯拉夫语系语言。
大型语言模型
支持多种语言
G
tknez
81
2
Allura Org Gemma 3 Glitter 4B GGUF
基于allura-org/Gemma-3-Glitter-4B转换的GGUF格式模型文件,使用imatrix量化优化性能
大型语言模型
英语
A
ArtusDev
69
1
Doge 320M Instruct
Apache-2.0
Doge 320M 指导版是一个基于动态掩码注意力的轻量级语言模型,采用监督微调(SFT)和直接偏好优化(DPO)训练,适用于问答和对话任务。
大型语言模型
Transformers
英语
D
SmallDoge
12.61k
3
Lughaat 1.0 8B Instruct
Apache-2.0
Lughaat-1.0-8B-Instruct是基于Llama 3.1 8B架构构建的乌尔都语大模型,专门在最大乌尔都语数据集上训练,在乌尔都语任务中表现优异。
大型语言模型
Transformers
支持多种语言
L
muhammadnoman76
42
2
Thedrummer Fallen Gemma3 4B V1 GGUF
其他
这是一个基于TheDrummer/Fallen-Gemma3-4B-v1模型的量化版本,使用llama.cpp进行量化处理,适用于文本生成任务。
大型语言模型
T
bartowski
2,106
3
Mistral Small 3.1 24B Instruct 2503 GPTQ 4b 128g
Apache-2.0
本模型是对Mistral-Small-3.1-24B-Instruct-2503进行INT4量化的版本,通过GPTQ算法将权重从16位降至4位,显著减少磁盘大小和GPU内存需求。
大型语言模型
M
ISTA-DASLab
21.89k
13