指令微调优化
Tiiuae.falcon H1 34B Instruct GGUF
Falcon-H1-34B-Instruct 是一个34B参数规模的大型语言模型,专注于指令遵循任务。
大型语言模型
T
DevQuasar
319
1
Hyperclovax SEED Text Instruct 0.5B GGUF
其他
基于llama.cpp生成的0.5B参数规模的文本生成模型,支持指令式文本生成任务
大型语言模型
H
Mungert
407
1
Thedrummer Rivermind Lux 12B V1 GGUF
这是一个12B参数的大语言模型,经过llama.cpp的imatrix量化处理,提供多种量化版本以适应不同硬件需求。
大型语言模型
T
bartowski
1,353
1
MN Nyx Chthonia 12B
这是一个基于多个12B参数规模模型的合并版本,采用model_stock方法融合了7个不同特性的预训练语言模型,以增强综合能力。
大型语言模型
Transformers
M
mergekit-community
31
2
Granite 3.3 8b Instruct Q8 0 GGUF
Apache-2.0
该模型是基于IBM Granite-3.3-8B指令微调模型转换而来的GGUF格式模型,适用于文本生成任务。
大型语言模型
G
NikolayKozloff
36
2
Opencodereasoning Nemotron 7B
Apache-2.0
OpenCodeReasoning-Nemotron-7B 是基于 Qwen2.5-7B-Instruct 开发的大型语言模型,专注于代码生成和推理任务,支持 32K tokens 的上下文长度。
大型语言模型
Transformers
支持多种语言
O
nvidia
5,410
30
Llama SEA LION V3.5 70B R
Llama-SEA-LION-v3.5-70B-R 是一个专为东南亚语言优化的混合功能大语言模型,支持13种语言,具备复杂推理和通用文本生成能力。
大型语言模型
Transformers
支持多种语言
L
aisingapore
2,406
1
Flan T5 Titlegen Springer
MIT
基于google/flan-t5-base微调的模型,专门用于将科学摘要精炼为简洁标题的抽象摘要生成任务。
文本生成
Transformers
英语
F
tiam4tt
236
0
Qwen.qwen2.5 VL 3B Instruct GGUF
Qwen2.5-VL-3B-Instruct 是一个3B参数的视觉语言模型,支持图文生成文本任务。
图像生成文本
Q
DevQuasar
1,107
3
Llama 3.1 8B SuperNova EtherealHermes GGUF
Apache-2.0
基于Llama-3.1架构的8B参数大语言模型,提供多种量化版本的GGUF格式文件
大型语言模型
英语
L
tensorblock
44
1
Nano R1 Model
Apache-2.0
基于Unsloth和Huggingface TRL库优化的Qwen2模型,推理速度提升2倍
大型语言模型
Transformers
英语
N
Mansi-30
25
2
T3Q Qwen2.5 14b V1.0 E3
Apache-2.0
基于Qwen/Qwen2.5-14B-Instruct-1M模型进行后训练的版本,采用LoRA-8-4-0.0001-cosine-32-16配置,训练数据为train_data_v1.0。
大型语言模型
Transformers
支持多种语言
T
JungZoona
1,557
25
Qwq 32B Gptqmodel 4bit Vortex V1
Apache-2.0
QwQ-32B是基于Qwen2架构的32B参数大语言模型,经过GPTQ方法4位整型量化处理,适用于高效文本生成任务。
大型语言模型
Safetensors
英语
Q
ModelCloud
1,620
11
Llama 3.1 8B UltraLong 1M Instruct
Nemotron-UltraLong-8B系列是专为处理超长文本序列设计的语言模型,支持最高400万token的上下文窗口,同时保持卓越性能。
大型语言模型
Transformers
英语
L
nvidia
1,387
26
Buddyglassuncensored2025.4
这是一个基于 Mistral-Small-24B-Instruct-2501 的融合模型,采用了 DARE TIES 融合方法,整合了多个 24B 参数规模的模型。
大型语言模型
Transformers
B
darkc0de
52
4
Llama Krikri 8B Instruct GGUF
基于Llama-3.1-8B构建的希腊语指令调优大语言模型,增强希腊语能力并支持多语言任务
大型语言模型
Transformers
L
ilsp
257
11
Captain Eris Violet V0.420 12B
其他
Captain Violet 是一个12B参数规模的合并模型,由Epiculous/Violet_Twilight-v0.2和Nitral-AI/Captain_BMO-12B通过mergekit工具合并而成,支持文本生成任务。
大型语言模型
Transformers
英语
C
Nitral-AI
445.12k
41
Ichigo Llama3.1 S Instruct V0.4
Apache-2.0
基于Llama-3架构的多模态语言模型,支持音频和文本输入理解,具有噪声鲁棒性和多轮对话能力
文本生成音频
英语
I
homebrewltd
486
19
Hymba 1.5B Instruct
其他
基于Hymba-1.5B-Base进行指令微调的15亿参数模型,具备数学推理、函数调用、角色扮演等复杂任务处理能力
大型语言模型
Transformers
H
nvidia
3,547
227
Videollama2.1 7B 16F Base
Apache-2.0
VideoLLaMA2.1是基于VideoLLaMA2的升级版本,专注于提升视频大语言模型中的时空建模与音频理解能力。
视频生成文本
Transformers
英语
V
DAMO-NLP-SG
179
1
Videollama2.1 7B 16F
Apache-2.0
VideoLLaMA 2是一个多模态大语言模型,专注于视频理解,具备时空建模和音频理解能力。
文本生成视频
Transformers
英语
V
DAMO-NLP-SG
2,813
10
Llama 3.1 8B Dragonfly V2
蜻蜓是基于Llama 3.1通过指令微调训练的多模态视觉语言模型,支持图像与文本的联合理解与生成
图像生成文本
英语
L
togethercomputer
113
1
Llama 3.2 Korean Bllossom 3B
Bllossom-3B是基于meta-llama/Meta-Llama-3.2-3B的韩英双语增强版本,通过全参数微调和精选韩语数据训练,完整保留英语能力的同时增强韩语处理能力。
大型语言模型
Transformers
支持多种语言
L
Bllossom
12.52k
173
Mini Ichigo Llama3.2 3B S Instruct
Apache-2.0
Ichigo-llama3s系列模型是由Homebrew Research开发的多模态语言模型,原生支持音频和文本输入理解。
文本生成音频
Safetensors
英语
M
Menlo
22
34
Ichigo Llama3.1 S Instruct V0.3 Phase 2
Apache-2.0
Ichigo-llama3s系列模型原生支持音频和文本输入理解,基于Llama-3架构,使用WhisperVQ作为音频文件的tokenizer。
文本生成音频
英语
I
homebrewltd
16
5
Llama 3.1 8B Instuct Uz GGUF
这是基于behbudiy/Llama-3.1-8B-Instuct-Uz的静态量化版本,支持乌兹别克语和英语,适用于多种文本生成任务。
大型语言模型
支持多种语言
L
mradermacher
241
1
Mistral Nemo Base 2407 Chatml
Apache-2.0
Mistral-Nemo-Base-2407是由Mistral AI与NVIDIA联合训练的120亿参数生成式文本预训练模型,性能超越同规模或更小规模的模型。
大型语言模型
Transformers
支持多种语言
M
IntervitensInc
191
3
Meta Llama 3.1 8B Instruct GGUF
Llama-3.1-8B-Instruct 是由 Meta 发布的一个 8B 参数规模的大语言模型,专注于指令跟随任务。
大型语言模型
M
DevQuasar
485
3
Tarsier 34b
Apache-2.0
Tarsier-34b 是一个开源的大规模视频语言模型,专注于生成高质量的视频描述,并在多个公开基准测试中取得领先成绩。
视频生成文本
Transformers
T
omni-research
103
17
UCCIX Llama2 13B Instruct
Apache-2.0
UCCIX-Llama2-13B-Instruct是一款爱尔兰语-英语双语大语言模型,基于Llama 2-13B架构开发,特别优化了爱尔兰语处理能力。
大型语言模型
Transformers
支持多种语言
U
ReliableAI
21
2
Llama3 8B Cn Rochat V1
Apache-2.0
基于hfl/llama-3-chinese-8b-instruct-v3进行指令微调的中文角色扮演优化模型
大型语言模型
Transformers
L
RochatAI
14
7
Orca Mini V5 8b Dpo
基于Llama 3架构的8B参数模型,使用多种DPO数据集训练,专注于文本生成任务
大型语言模型
Transformers
英语
O
pankajmathur
16
3
Wizardlm 2 7B Abliterated
Apache-2.0
WizardLM-2-7B的消融版本,经过正交化处理以优化特定行为模式
大型语言模型
Transformers
W
fearlessdots
237
14
Mistral 7B V0.3
Apache-2.0
Mistral-7B-v0.3是基于Mistral-7B-v0.2升级的大语言模型,主要改进是扩展了词汇表至32768个词元。
大型语言模型
Transformers
M
mistralai
442.55k
472
Llama 3 Stinky V2 8B
其他
这是一个基于Llama-3架构的8B参数模型,通过mergekit工具合并了多个预训练模型,具有较好的文本生成能力。
大型语言模型
Transformers
L
nbeerbower
39
5
Xgen Mm Phi3 Mini Base R V1
Apache-2.0
XGen-MM是Salesforce AI Research开发的最新多模态大模型系列,基于BLIP的成功设计,通过基础性增强实现了更强大、更优越的模型架构。
图像生成文本
Transformers
英语
X
Salesforce
240
18
LLAMA 3 Quantized
MIT
Meta Llama 3 - 8B Instruct大语言模型的8位量化版本,减小模型体积并提升推理速度,适合资源有限设备部署。
大型语言模型
Transformers
L
Kameshr
18
9
Idefics2 8b Chatty
Apache-2.0
Idefics2 是一个开放的多模态模型,能够接受任意序列的图像和文本输入并生成文本输出。
图像生成文本
Transformers
英语
I
HuggingFaceM4
617
94
Mistral 7b V0.3 Summarizer
Mistral-7B-Instruct-v0.3 是一个基于 Mistral-7B 的指令调优版本,专注于遵循人类指令的文本生成任务。
大型语言模型
Transformers
英语
M
devesh-2002
22
0
Granite 8b Code Instruct 4k
Apache-2.0
Granite-8B-Code-Instruct-4K是一个80亿参数的代码指令模型,基于Granite-8B-Code-Base-4K在多种允许许可的指令数据上进行微调,增强了其遵循指令的能力,包括逻辑推理和问题解决技能。
大型语言模型
Transformers
其他
G
ibm-granite
1,481
110