多语言指令微调

# 多语言指令微调

Mistral Small 3.2 24B Instruct 2506 Bf16

这是一个基于Mistral-Small-3.2-24B-Instruct-2506转换的MLX格式模型，适用于指令跟随任务。

大型语言模型支持多种语言

Samastam是Sarvam-1模型的早期指导变体，基于Alpaca-cleaned数据集微调，支持多语言指令响应。

大型语言模型

Mistral Small 24B Instruct 2501 GGUF

Mistral-Small-24B-Instruct-2501 是一个24B参数规模的指令微调大语言模型，支持多语言文本生成任务。

大型语言模型支持多种语言

Llama 3.3 70B Instruct Abliterated GGUF

基于Llama 3.3架构的70B参数大语言模型，支持多语言文本生成任务，经过量化优化适用于不同硬件环境

大型语言模型支持多种语言

Granite 3.3 2b Instruct GGUF

IBM-Granite的20亿参数指导模型，支持多语言和长上下文任务，具备结构化推理能力。

大型语言模型

lmstudio-community

Llama 4 Scout 17B 16E Instruct GGUF

Llama-4-Scout-17B-16E-Instruct-GGUF是一款基于Llama-4-Scout-17B-16E-Instruct模型的量化版本，支持多语言处理，适用于聊天和指令任务。

大型语言模型

Transformers 支持多种语言

Llama 4 Maverick 17B 128E Instruct 6bit

基于Meta Llama 4模型转换的6位量化版本，支持多语言指令交互

大型语言模型

Transformers 支持多种语言

Llama 4 Scout 17B 16E Instruct Bnb 4bit

这是原始模型 meta-llama/Llama-4-Scout-17B-16E-Instruct 的量化版本，采用 int4 量化技术优化，适用于多语言任务。

大型语言模型

Transformers 支持多种语言

Llama 4 Maverick 17B 16E Instruct 4bit

基于meta-llama/Llama-4-Maverick-17B-128E-Instruct转换的4位量化模型，支持多语言文本生成任务

大型语言模型支持多种语言

Mistral Small 3.1 24B Instruct 2503 Q5 K M GGUF

基于Mistral Small 3.1的24B参数指令微调模型，支持多语言和视觉理解，适用于本地部署和高效推理。

文本生成图像支持多种语言

Llama 3.1 70B Instruct GGUF

基于Llama-3.1-70B的超低位量化(1-2位)模型，采用IQ-DynamicGate技术实现精度自适应量化，在保持内存效率的同时提升准确性。

大型语言模型支持多种语言

Qwen2.5 7B Latent Verification

Qwen2.5-7B-Instruct 是通义千问大模型系列的最新7B参数指令微调模型，具备增强的知识量、代码与数学能力，支持128K tokens长上下文和多语言处理。

大型语言模型

Transformers 英语

Mistral Small 3.1 24B Instruct 2503 GGUF

Mistral-Small-3.1-24B-Instruct-2503-GGUF 是一个经过量化处理的多语言模型，支持多种语言处理，可借助 Gaianet 运行。

大型语言模型

Transformers 支持多种语言

Mistral Small 3.1 24B Instruct 2503 GGUF

Mistral-Small-3.1-24B-Instruct-2503 是一个24B参数规模的多语言指令微调模型，支持多种语言和任务，适用于文本生成和对话场景。

大型语言模型支持多种语言

Gams 9B Instruct

GaMS-9B-Instruct是基于谷歌Gemma 2系列改进的斯洛文尼亚生成模型，支持斯洛文尼亚语、英语及部分克罗地亚语、塞尔维亚语和波斯尼亚语，专注于文本生成任务。

大型语言模型支持多种语言

基于多个Qwen系列32B参数模型的融合模型，采用Model Stock方法融合，增强多语言处理能力

大型语言模型

Salamandra 2b Instruct GGUF

基于GGUF格式的2B参数多语言指令微调模型，支持30+种语言，适用于文本生成任务。

大型语言模型

EXAONE 3.5 32B Instruct Llamafied

这是LG AI Research开发的EXAONE-3.5-32B-Instruct模型的llamafied版本，是一个支持英语和韩语的大语言模型。

大型语言模型

Transformers 支持多种语言

Teuken 7B Instruct Commercial V0.4 GGUF

Teuken-7B-instruct-commercial-v0.4 是一个多语言支持的指令微调大语言模型，适用于商业用途，提供文本生成功能。

大型语言模型

Transformers 支持多种语言

Granite 3.0 3b A800m Instruct

IBM开发的30亿参数指令微调语言模型，基于Granite-3.0架构，支持多语言任务和商业应用

大型语言模型

Granite 3.0 8b Instruct

Granite-3.0-8B-Instruct是一个基于Granite-3.0-8B-Base微调的80亿参数模型，采用多种开源指令数据集和内部合成的数据集组合进行训练。

大型语言模型

Llama 3.2 3B Instruct Q8 0 GGUF

Llama 3.2是由Meta发布的30亿参数指令微调大语言模型，支持多语言文本生成任务

大型语言模型支持多种语言

Llama 3.2 1B Instruct Q8 0 GGUF

这是Meta发布的Llama 3.2系列中的10亿参数指令微调模型，已转换为GGUF格式便于在llama.cpp中使用

大型语言模型支持多种语言

Llama 3.2 3B Instruct Q4 K M GGUF

这是一个基于Meta的Llama-3.2-3B-Instruct模型转换而来的GGUF格式量化版本，适用于高效推理。

大型语言模型支持多种语言

Gemma 2 2b Jpn It

Gemma 2 JPN是基于日语文本微调的Gemma 2 2B模型，具有出色的日语处理能力，适用于多种文本生成任务。

大型语言模型

Transformers 日语

Mistral Nemo Instruct 2407

Mistral-Nemo-Instruct-2407是基于Mistral-Nemo-Base-2407进行指令微调的大语言模型，由Mistral AI与NVIDIA联合训练，性能超越同规模或更小的现有模型。

大型语言模型

Transformers 支持多种语言

Aya 23是一个经过指令微调的开放权重研究版本模型，具备高度先进的多语言能力，支持23种语言。

大型语言模型

Transformers 支持多种语言

Llama 3 Wissenschaft 8B

基于Llama-3-8b构建的多语言混合模型，融合了德语、意大利语和英语能力

大型语言模型

Llamantino 3 ANITA 8B Inst DPO ITA

LLaMAntino-3-ANITA是基于Meta Llama 3构建的多语言（英语+意大利语）大型语言模型，专为意大利语NLP任务优化。

大型语言模型

Transformers 支持多种语言

Mixtral 8x22B Instruct V0.1

Mixtral-8x22B-Instruct-v0.1是基于Mixtral-8x22B-v0.1进行指令微调的大语言模型，支持多种语言和函数调用功能。

大型语言模型

Transformers 支持多种语言

Indic Gemma 2b Finetuned Sft Navarasa 2.0

基于Gemma-2b微调的多语言指令模型，支持15种印度语言及英语

大型语言模型

Transformers 支持多种语言

Telugu-LLM-Labs

Calme 7B Instruct V0.2

Calme-7B是一款基于Mistral-7B微调的70亿参数语言模型，擅长生成清晰、平和且连贯的文本。

大型语言模型

Mistral 7B Instruct Aya 101

基于Mistral-7B-Instruct-v0.2微调的多语言指令跟随模型，支持101种语言

大型语言模型

Transformers 支持多种语言

Aya 101 是一个支持101种语言指令的大规模多语言生成式语言模型，在各类评估中优于同类模型。

大型语言模型

Transformers 支持多种语言

Mixtral 8x7B Instruct V0.1

Mixtral-8x7B是一个预训练的生成式稀疏混合专家模型，在多数基准测试中表现优于Llama 2 70B。

大型语言模型

Transformers 支持多种语言

Falcon 7B Instruct GPTQ

Falcon-7B-Instruct的4位量化版本，使用AutoGPTQ工具进行量化，适用于资源受限环境下的高效推理。

大型语言模型

Transformers 英语

Flan T5 Xxl Sharded Fp16

FLAN-T5 XXL 是Google发布的T5模型变体，在超过1000个额外任务上进行了微调，支持多种语言，性能优于原始T5模型。

大型语言模型

FLAN-T5 XL是基于T5架构的指令微调语言模型，在1000+任务上微调后，多语言和少样本性能显著提升。

大型语言模型支持多种语言

FLAN-T5是基于T5模型通过指令微调优化的语言模型，支持多语言任务处理，在相同参数量下性能优于原T5模型。

大型语言模型支持多种语言

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24