长文本生成
Dans PersonalityEngine V1.3.0 24b Q8 0 GGUF
Apache-2.0
这是一个基于PocketDoc/Dans-PersonalityEngine-V1.3.0-24b转换的GGUF格式模型,适用于多种文本生成任务。
大型语言模型
Transformers
D
Merlinoz11
111
1
Archaeo 32B KTO
基于Archaeo-32B进行强化学习训练的融合模型,专为角色扮演与创意写作优化
大型语言模型
Transformers
其他
A
Delta-Vector
25
1
Qwen3 0.6B Unsloth Bnb 4bit
Apache-2.0
Qwen3是Qwen系列最新一代的大语言模型,提供了一套全面的密集和混合专家(MoE)模型。
大型语言模型
Transformers
英语
Q
unsloth
50.36k
7
Magnum V4 27b Gguf
基于Gemma 27b微调的对话模型,旨在复现Claude 3的文本质量,支持ChatML格式的对话交互。
大型语言模型
英语
M
anthracite-org
1,220
31
Qwen2.5 1.5B Instruct GGUF
Apache-2.0
Qwen2.5是Qwen大语言模型的最新系列,1.5B参数规模的指令调优模型,支持多语言和长文本生成。
大型语言模型
英语
Q
Mungert
556
4
Badger Writer Llama 3 8b
Badger Writer 是基于多个 Llama 3 8B 模型的归一化傅里叶任务叠加模型,专注于文本生成任务,特别擅长创意写作和指令跟随。
大型语言模型
Transformers
B
maldv
106
10
Wanabi 24b Preview Gguf
Apache-2.0
专为日语小说创作辅助而微调的大规模语言模型预览版本
大型语言模型
日语
W
kawaimasa
148
3
Zhi Writing Dsr1 14b
Apache-2.0
基于DeepSeek-R1-Distill-Qwen-14B微调优化的创意写作增强模型,在创意写作方面表现显著提升
大型语言模型
Transformers
支持多种语言
Z
Zhihu-ai
133
16
Gemma 3 12B It Qat GGUF
Gemma 3 12B IT是由谷歌开发的大语言模型,支持多模态输入和长上下文处理。
图像生成文本
G
lmstudio-community
36.65k
4
Gemma 3 4B It Qat GGUF
Google出品的Gemma 3 4B IT模型,支持多模态输入和长上下文处理,适用于文本生成和图像理解任务。
图像生成文本
G
lmstudio-community
46.55k
10
Qwen2.5 0.5B Instruct
Apache-2.0
专为Gensyn强化学习群设计的0.5B参数指令微调模型,支持本地微调训练
大型语言模型
Transformers
英语
Q
Gensyn
2.4M
5
Qwen2.5 7B Latent Verification
Apache-2.0
Qwen2.5-7B-Instruct 是通义千问大模型系列的最新7B参数指令微调模型,具备增强的知识量、代码与数学能力,支持128K tokens长上下文和多语言处理。
大型语言模型
Transformers
英语
Q
jacobpwarren
32
4
Ganymede Llama 3.3 3B Preview
基于Llama-3.2-3B-Instruct架构的强化推理模型,擅长数学分析、逻辑推理和结构化数据理解。
大型语言模型
Transformers
支持多种语言
G
prithivMLmods
29
2
Trillion 7B Preview AWQ
Apache-2.0
Trillion-7B预览版是一款多语言大语言模型,支持英语、韩语、日语和中文,在计算效率和性能表现上优于同类7B规模模型。
大型语言模型
支持多种语言
T
trillionlabs
22
4
T3Q Qwen2.5 14b V1.2 E2
Apache-2.0
T3Q-qwen2.5-14b-v1.2-e2是基于Qwen/Qwen2.5-14B-Instruct-1M模型进行后训练的版本,采用LoRA-8-4-0.0001-cosine-32-16配置,训练数据为train_data_v1.2。
大型语言模型
Transformers
支持多种语言
T
JungZoona
119
8
T3Q Qwen2.5 14b V1.0 E3 Q4 K M GGUF
Apache-2.0
这是一个基于Qwen2.5-14B-Instruct-1M的量化模型,转换为GGUF格式,适用于llama.cpp框架。
大型语言模型
支持多种语言
T
Sangto
1,126
4
Sombrero QwQ 32B Elite11
Apache-2.0
基于Qwen的QwQ 32B架构优化的大语言模型,专注于高效内存利用、编程辅助和复杂问题解决。
大型语言模型
Transformers
英语
S
prithivMLmods
1,201
8
Hiber Multi 10B Instruct
Hiber-Multi-10B-Instruct 是一个基于 Transformer 架构的先进多语言大模型,支持多种语言,具有100亿参数,适用于文本生成任务。
大型语言模型
Transformers
支持多种语言
H
Hibernates
86
2
Allam 7B Instruct Preview
Apache-2.0
ALLaM是由沙特数据与人工智能管理局(SDAIA)开发的阿拉伯语言技术大语言模型,支持阿拉伯语和英语,采用完全从头训练模式,具有70亿参数。
大型语言模型
Transformers
支持多种语言
A
ALLaM-AI
8,686
109
ARWKV R1 7B
Apache-2.0
基于纯RNN的70亿参数模型,通过知识蒸馏训练,展示RWKV-7的高效循环机制和无自注意力架构。
大型语言模型
Transformers
支持多种语言
A
RWKV-Red-Team
113
10
Rwkv7 1.5B World
Apache-2.0
采用闪存线性注意力架构的RWKV-7模型,支持多语言文本生成任务。
大型语言模型
Transformers
支持多种语言
R
fla-hub
632
9
QVQ 72B Preview Abliterated GPTQ Int8
其他
这是QVQ-72B-Preview-abliterated模型的GPTQ量化8位版本,支持图像文本到文本的转换任务。
图像生成文本
Transformers
英语
Q
huihui-ai
48
1
14B Qwen2.5 Freya X1
其他
基于Qwen2.5-14B和Qwen2.5-14B-Instruct模型的多阶段训练模型,专注于文本生成和指令理解任务。
大型语言模型
Transformers
1
Sao10K
252
16
Llama 3.3 70B Instruct Abliterated Finetuned GPTQ Int8
这是基于Llama-3.3-70B-Instruct模型的GPTQ量化8位版本,经过微调优化,适用于对话推理任务。
大型语言模型
Transformers
支持多种语言
L
huihui-ai
7,694
12
Patricide 12B Unslop Mell V2
Apache-2.0
基于mergekit工具合并的12B参数语言模型,融合了UnslopNemo-12B-v4的抗GPT特性和MN-12B-Mag-Mell-R1的智能表现,适用于创意写作和角色扮演场景
大型语言模型
Transformers
P
redrix
468
26
L3.3 70B Euryale V2.3
基于Llama 3.3 Instruct训练的70B参数大语言模型,专注于对话生成和创意内容创作
大型语言模型
Transformers
L
Sao10K
1,274
69
Bamba 9B V1
Apache-2.0
Bamba-9B 是基于 Mamba-2 架构的解码器专用语言模型,经过两阶段训练,擅长处理广泛的文本生成任务。
大型语言模型
B
ibm-ai-platform
16.19k
35
Magnum V4 123b Gguf
其他
基于Mistral-Large-Instruct微调的123B参数模型,旨在复现Claude 3的文本生成质量
大型语言模型
英语
M
anthracite-org
380
7
M Metaphors Of Madness 19.4B GGUF
Apache-2.0
基于Mistral架构的创意写作模型,以夸张文风和不可预测的创意输出著称,专为散文、小说创作和角色扮演设计。
大型语言模型
英语
M
DavidAU
277
3
Calmerys 78B Orpo V0.1
MIT
基于MaziyarPanahi/calme-2.4-rys-78b在mlabonne/orpo-dpo-mix-40k数据集上微调的大语言模型,在Open LLM Leaderboard上排名第一
大型语言模型
Transformers
英语
C
dfurman
353
74
Paligemma Longprompt V1 Safetensors
Gpl-3.0
实验性视觉模型,融合关键词标签与长文本描述生成图像提示词
图像生成文本
Transformers
P
mnemic
38
1
Yism 34B 0rn
Apache-2.0
YiSM-34B-0rn是一个基于Yi-1.5-34B和Yi-1.5-34B-Chat融合的大语言模型,旨在平衡指令遵循能力和基础模型特性。
大型语言模型
Transformers
Y
altomek
22
2
D AU Mistral 7B Instruct V0.2 Bagel DarkSapling DPO 7B V2.0 Imat Plus GGUF
MIT
这是一个基于Mistral-7B-Instruct的融合模型,结合了DarkSapling的角色扮演/故事生成能力和Bagel的部分特性,采用Imatrix Plus压缩技术提升质量
大型语言模型
D
DavidAU
122
1
Llama 3 Open Ko 8B Gguf
基于Llama-3-8B框架继续预训练的韩语语言模型,使用超过60GB去重文本数据训练
大型语言模型
支持多种语言
L
teddylee777
7,211
47
Opus V1.2 Llama 3 8b
专为故事创作与角色扮演优化的Llama 3 8B模型,支持可控叙事和交互式体验
大型语言模型
Transformers
英语
O
dreamgen
21
53
Wizardlm 2 8x22B GGUF
Apache-2.0
WizardLM-2-8x22B-GGUF是微软WizardLM-2-8x22B模型的GGUF格式量化版本,支持多种比特量化,适用于文本生成任务。
大型语言模型
W
MaziyarPanahi
9,720
127
Goku 8x22B V0.1
Apache-2.0
基于Mixtral-8x22B-v0.1微调的多语言大模型,总参数量1410亿,激活参数350亿
大型语言模型
Transformers
支持多种语言
G
MaziyarPanahi
35
9
Rwkv 5 World 7b
Apache-2.0
RWKV-5 Eagle 7B是基于RWKV架构的7B参数规模大语言模型,支持中文文本生成任务
大型语言模型
Transformers
R
SmerkyG
19
1
Mamba 2.8b Hf
基于Mamba架构的28亿参数语言模型,兼容HuggingFace Transformers库
大型语言模型
Transformers
M
state-spaces
8,731
103
Longalpaca 13B GGUF
LongAlpaca-13B-GGUF是基于Yukang/LongAlpaca-13B模型的GGUF格式量化版本,支持2-8比特的量化选项,适用于本地文本生成任务。
大型语言模型
L
MaziyarPanahi
285
3