多语言指令微调
Samastam It V1
Samastam是Sarvam-1模型的早期指导变体,基于Alpaca-cleaned数据集微调,支持多语言指令响应。
大型语言模型
Transformers
S
hathibelagal
188
1
Mistral Small 24B Instruct 2501 GGUF
Apache-2.0
Mistral-Small-24B-Instruct-2501 是一个24B参数规模的指令微调大语言模型,支持多语言文本生成任务。
大型语言模型
支持多种语言
M
bartowski
48.61k
111
Llama 3.3 70B Instruct Abliterated GGUF
基于Llama 3.3架构的70B参数大语言模型,支持多语言文本生成任务,经过量化优化适用于不同硬件环境
大型语言模型
支持多种语言
L
bartowski
7,786
8
Granite 3.3 2b Instruct GGUF
Apache-2.0
IBM-Granite的20亿参数指导模型,支持多语言和长上下文任务,具备结构化推理能力。
大型语言模型
G
lmstudio-community
444
2
Llama 4 Scout 17B 16E Instruct Bnb 4bit
其他
这是原始模型 meta-llama/Llama-4-Scout-17B-16E-Instruct 的量化版本,采用 int4 量化技术优化,适用于多语言任务。
大型语言模型
Transformers
支持多种语言
L
bnb-community
1,286
1
Llama 4 Maverick 17B 16E Instruct 4bit
其他
基于meta-llama/Llama-4-Maverick-17B-128E-Instruct转换的4位量化模型,支持多语言文本生成任务
大型语言模型
支持多种语言
L
mlx-community
538
6
Mistral Small 3.1 24B Instruct 2503 Q5 K M GGUF
Apache-2.0
基于Mistral Small 3.1的24B参数指令微调模型,支持多语言和视觉理解,适用于本地部署和高效推理。
文本生成图像
支持多种语言
M
Triangle104
57
1
Llama 3.1 70B Instruct GGUF
基于Llama-3.1-70B的超低位量化(1-2位)模型,采用IQ-DynamicGate技术实现精度自适应量化,在保持内存效率的同时提升准确性。
大型语言模型
支持多种语言
L
Mungert
19.52k
3
Qwen2.5 7B Latent Verification
Apache-2.0
Qwen2.5-7B-Instruct 是通义千问大模型系列的最新7B参数指令微调模型,具备增强的知识量、代码与数学能力,支持128K tokens长上下文和多语言处理。
大型语言模型
Transformers
英语
Q
jacobpwarren
32
4
Mistral Small 3.1 24B Instruct 2503 GGUF
Apache-2.0
Mistral-Small-3.1-24B-Instruct-2503 是一个24B参数规模的多语言指令微调模型,支持多种语言和任务,适用于文本生成和对话场景。
大型语言模型
支持多种语言
M
second-state
1,059
1
Gams 9B Instruct
GaMS-9B-Instruct是基于谷歌Gemma 2系列改进的斯洛文尼亚生成模型,支持斯洛文尼亚语、英语及部分克罗地亚语、塞尔维亚语和波斯尼亚语,专注于文本生成任务。
大型语言模型
支持多种语言
G
cjvt
1,652
2
QWQ Stock
基于多个Qwen系列32B参数模型的融合模型,采用Model Stock方法融合,增强多语言处理能力
大型语言模型
Transformers
Q
wanlige
368
7
Salamandra 2b Instruct GGUF
Apache-2.0
基于GGUF格式的2B参数多语言指令微调模型,支持30+种语言,适用于文本生成任务。
大型语言模型
Transformers
S
tensorblock
120
1
EXAONE 3.5 32B Instruct Llamafied
其他
这是LG AI Research开发的EXAONE-3.5-32B-Instruct模型的llamafied版本,是一个支持英语和韩语的大语言模型。
大型语言模型
Transformers
支持多种语言
E
beomi
483
5
Granite 3.0 3b A800m Instruct
Apache-2.0
IBM开发的30亿参数指令微调语言模型,基于Granite-3.0架构,支持多语言任务和商业应用
大型语言模型
Transformers
G
ibm-granite
5,240
18
Granite 3.0 8b Instruct
Apache-2.0
Granite-3.0-8B-Instruct是一个基于Granite-3.0-8B-Base微调的80亿参数模型,采用多种开源指令数据集和内部合成的数据集组合进行训练。
大型语言模型
Transformers
G
ibm-granite
24.29k
201
Llama 3.2 3B Instruct Q8 0 GGUF
Llama 3.2是由Meta发布的30亿参数指令微调大语言模型,支持多语言文本生成任务
大型语言模型
支持多种语言
L
hugging-quants
26.89k
46
Llama 3.2 1B Instruct Q8 0 GGUF
这是Meta发布的Llama 3.2系列中的10亿参数指令微调模型,已转换为GGUF格式便于在llama.cpp中使用
大型语言模型
支持多种语言
L
hugging-quants
64.04k
31
Gemma 2 2b Jpn It
Gemma 2 JPN是基于日语文本微调的Gemma 2 2B模型,具有出色的日语处理能力,适用于多种文本生成任务。
大型语言模型
Transformers
日语
G
google
7,510
183
Mistral Nemo Instruct 2407
Apache-2.0
Mistral-Nemo-Instruct-2407是基于Mistral-Nemo-Base-2407进行指令微调的大语言模型,由Mistral AI与NVIDIA联合训练,性能超越同规模或更小的现有模型。
大型语言模型
Transformers
支持多种语言
M
mistralai
149.79k
1,519
Llama 3 Wissenschaft 8B
其他
基于Llama-3-8b构建的多语言混合模型,融合了德语、意大利语和英语能力
大型语言模型
Transformers
L
nbeerbower
15
4
Llamantino 3 ANITA 8B Inst DPO ITA
LLaMAntino-3-ANITA是基于Meta Llama 3构建的多语言(英语+意大利语)大型语言模型,专为意大利语NLP任务优化。
大型语言模型
Transformers
支持多种语言
L
swap-uniba
6,401
25
Mixtral 8x22B Instruct V0.1
Apache-2.0
Mixtral-8x22B-Instruct-v0.1是基于Mixtral-8x22B-v0.1进行指令微调的大语言模型,支持多种语言和函数调用功能。
大型语言模型
Transformers
支持多种语言
M
mistralai
12.80k
723
Indic Gemma 2b Finetuned Sft Navarasa 2.0
其他
基于Gemma-2b微调的多语言指令模型,支持15种印度语言及英语
大型语言模型
Transformers
支持多种语言
I
Telugu-LLM-Labs
166
24
Calme 7B Instruct V0.2
Apache-2.0
Calme-7B是一款基于Mistral-7B微调的70亿参数语言模型,擅长生成清晰、平和且连贯的文本。
大型语言模型
Transformers
C
MaziyarPanahi
15
14
Mistral 7B Instruct Aya 101
Apache-2.0
基于Mistral-7B-Instruct-v0.2微调的多语言指令跟随模型,支持101种语言
大型语言模型
Transformers
支持多种语言
M
MaziyarPanahi
92
12
Aya 101
Apache-2.0
Aya 101 是一个支持101种语言指令的大规模多语言生成式语言模型,在各类评估中优于同类模型。
大型语言模型
Transformers
支持多种语言
A
CohereLabs
3,468
640
Mixtral 8x7B Instruct V0.1
Apache-2.0
Mixtral-8x7B是一个预训练的生成式稀疏混合专家模型,在多数基准测试中表现优于Llama 2 70B。
大型语言模型
Transformers
支持多种语言
M
mistralai
505.97k
4,397
Flan T5 Xxl Sharded Fp16
Apache-2.0
FLAN-T5 XXL 是Google发布的T5模型变体,在超过1000个额外任务上进行了微调,支持多种语言,性能优于原始T5模型。
大型语言模型
Transformers
F
philschmid
531
54
Flan T5 Xl
Apache-2.0
FLAN-T5 XL是基于T5架构的指令微调语言模型,在1000+任务上微调后,多语言和少样本性能显著提升。
大型语言模型
支持多种语言
F
google
257.40k
494
Flan T5 Base
Apache-2.0
FLAN-T5是基于T5模型通过指令微调优化的语言模型,支持多语言任务处理,在相同参数量下性能优于原T5模型。
大型语言模型
支持多种语言
F
google
3.3M
862