Devstral Small 2505 Unsloth Bnb 4bit
Apache-2.0
Devstral是由Mistral AI和All Hands AI合作开发的软件工程任务代理型大语言模型,擅长使用工具探索代码库、编辑多个文件以及驱动软件工程代理。
大型语言模型
Safetensors
支持多种语言
D
unsloth
873
3
Devstral Small 2505 GGUF
Apache-2.0
Devstral是一款专为软件工程任务设计的智能LLM,由Mistral AI和All Hands AI合作开发,擅长代码探索、多文件编辑和驱动软件工程代理。
大型语言模型
支持多种语言
D
unsloth
72.26k
64
Kernelllm GGUF
其他
KernelLLM是基于Llama 3.1 Instruct微调的模型,专门用于编写使用Triton的GPU内核。
大型语言模型
K
lmstudio-community
214
1
Devstral Small 2505
Apache-2.0
Devstral是由Mistral AI与All Hands AI合作开发的面向软件工程任务的智能大语言模型,擅长代码库探索、多文件编辑和驱动软件工程代理。
大型语言模型
Safetensors
支持多种语言
D
mistralai
102.17k
601
Xgen Small 9B Instruct R
xGen-small是一款企业级紧凑型语言模型,通过领域聚焦的数据整理、可扩展的预训练、长度扩展和强化学习微调,以可预测的低成本实现长上下文性能表现。
大型语言模型
Transformers

英语
X
Salesforce
97
4
Zero Mistral 24B
MIT
Zero-Mistral-24B是基于Mistral-Small-3.1-24B-Instruct-2503改进的纯文本模型,主要适配俄语和英语,移除了原版的视觉功能,专注于文本生成任务。
大型语言模型
Transformers

支持多种语言
Z
ZeroAgency
41
2
Pixtral 12b GGUF
Apache-2.0
Mistral-Community推出的多模态大模型,支持图像和文本处理,具备128k上下文长度和可变图像尺寸处理能力。
图像生成文本
P
lmstudio-community
611
1
Xlam 2 1b Fc R
xLAM-2是Salesforce研发的大型动作模型系列,专注于多轮对话和函数调用能力,可作为AI代理的核心组件。
大型语言模型
Transformers

英语
X
Salesforce
63
2
Llama 3.1 405B Instruct
Llama 3.1是由Meta开发的多语言大语言模型系列,包含8B、70B和405B三种规模,支持多语言文本生成和代码生成任务。
大型语言模型
Transformers

支持多种语言
L
meta-llama
34.83k
569
Saanvi C0 12B
Apache-2.0
120亿参数大语言模型,专为速度、效率和上下文准确性优化,支持RAG增强技术和128k上下文窗口。
大型语言模型
Transformers

S
riple-saanvi-lab
170
2
Qwen2.5 The Wisemen QwQ Deep Tiny Sherlock 32B
Apache-2.0
基于QwQ-32B推理与思维模型,融合了多个顶级推理模型的特色,专注于减少提示中的'过度思考',适用于创意用例和深入推理。
大型语言模型
Transformers

其他
Q
DavidAU
763
4
Llama3.1 MOE 4X8B Gated IQ Multi Tier COGITO Deep Reasoning 32B GGUF
Apache-2.0
一个具备可调节推理能力的混合专家(MoE)模型,通过4个8B模型的协作实现增强推理和文本生成能力
大型语言模型
支持多种语言
L
DavidAU
829
2
Llama SEA LION V3.5 70B R
Llama-SEA-LION-v3.5-70B-R 是一个专为东南亚语言优化的混合功能大语言模型,支持13种语言,具备复杂推理和通用文本生成能力。
大型语言模型
Transformers

支持多种语言
L
aisingapore
2,406
1
Llama SEA LION V3.5 8B R
Llama-SEA-LION-v3.5-8B-R是一个针对东南亚语言优化的8B参数大型语言模型,支持13种东南亚语言,具备复杂推理和通用文本生成能力。
大型语言模型
Transformers

支持多种语言
L
aisingapore
1,975
2
Cogito V1 Preview Qwen 32B Exl2 4.65bpw
Apache-2.0
Cogito v1 预览版是基于Qwen2.5-32B的指令调优生成式模型,支持30多种语言,上下文长度达128k,针对编程、STEM、指令遵循和通用帮助性进行了优化。
大型语言模型
Transformers

C
async0x42
27
3
Xlam 2 3b Fc R
xLAM-2系列是基于先进数据合成和训练流程构建的大型动作模型(LAMs),专注于多轮对话和工具使用,在函数调用和代理任务中表现卓越。
大型语言模型
Transformers

英语
X
Salesforce
353
5
Xlam 2 32b Fc R
xLAM-2是Salesforce推出的新一代大型动作模型,专注于多轮对话和函数调用能力,能够将用户意图转化为可执行动作,作为AI代理的核心组件。
大型语言模型
Transformers

英语
X
Salesforce
319
4
Llama Xlam 2 8b Fc R
xLAM-2系列是基于APIGen-MT框架训练的大型动作模型,专注于多轮对话和函数调用能力,适用于AI代理开发。
大型语言模型
Transformers

英语
L
Salesforce
778
8
Llama Xlam 2 70b Fc R
xLAM-2是SalesforceAIResearch开发的大型动作模型(LAM)系列,专注于将用户意图转化为可执行动作,增强AI代理的决策能力。
大型语言模型
Transformers

英语
L
Salesforce
420
10
Qwen2.5 MOE 2X1.5B DeepSeek Uncensored Censored 4B Gguf
Apache-2.0
这是一个Qwen2.5 MOE(专家混合)模型,由两个Qwen 2.5 DeepSeek(审查版/普通版和无审查版)1.5B模型组成,形成一个4B模型,其中无审查版本的DeepSeek Qwen 2.5 1.5B主导模型行为。
大型语言模型
支持多种语言
Q
DavidAU
678
5
Llama 3.2 11b Vision R1 Distill
Llama 3.2-Vision是由Meta开发的多模态大语言模型,支持图像和文本输入,针对视觉识别、图像推理和描述任务进行了优化。
图像生成文本
Transformers

支持多种语言
L
bababababooey
29
1
Meta Llama 3.1 8B Instruct FP16
Llama 3.1是Meta开发的多语言大语言模型集合,包含8B、70B和405B参数版本,支持8种语言,针对对话用例优化。
大型语言模型
Safetensors
支持多种语言
M
context-labs
565.13k
1
L3.2 Rogue Creative Instruct Uncensored 7B GGUF
Apache-2.0
基于Llama 3.2架构的7B参数无审查创意写作模型,支持128k上下文长度,专为小说创作、情节生成和角色扮演优化
大型语言模型
英语
L
DavidAU
577
7
Llama 3.2 3B Instruct AWQ
Llama 3.2是Meta推出的多语言大语言模型集合,包含1B和3B参数规模的预训练和指令调优版本,针对多语言对话用例优化,支持8种官方语言。
大型语言模型
Transformers

支持多种语言
L
AMead10
4,500
2
Llama 3.2 1B Instruct
Llama 3.2是一组预训练和指令调优的生成模型,包含1B和3B规模,针对多语言对话用例进行了优化,包括代理检索和摘要任务。
大型语言模型
Transformers

支持多种语言
L
alpindale
31.82k
2
Vikhr Nemo 12B Instruct R 21 09 24
Apache-2.0
Vikhr-Nemo是基于Mistral-Nemo-Instruct-2407优化的双语大语言模型,专为俄语和英语优化,支持逻辑推理、文本摘要、代码生成等多种任务。
大型语言模型
Transformers

支持多种语言
V
Vikhrmodels
3,707
118
Llama 3.2 90B Vision Instruct
Llama 3.2-Vision是Meta开发的多模态大语言模型,支持图像和文本输入,文本输出,在视觉识别、图像推理、图像描述和图像问答任务上表现优异。
图像生成文本
Transformers

支持多种语言
L
meta-llama
15.44k
337
Llama 3.2 11B Vision
Llama 3.2-Vision是由Meta开发的多模态大语言模型系列,包含11B和90B两种规模,支持图像+文本输入和文本输出,针对视觉识别、图像推理、图像描述和图像问答任务进行了优化。
图像生成文本
Transformers

支持多种语言
L
meta-llama
31.12k
511
Llama 3.2 3B
Llama 3.2是Meta开发的多语言大语言模型系列,包含1B和3B规模的预训练及指令调优生成模型,针对多语言对话场景优化,支持文本输入/输出。
大型语言模型
Transformers

支持多种语言
L
meta-llama
602.29k
555
Llama 3.2 3B Instruct
Llama 3.2是由Meta开发的多语言大语言模型系列,包含1B和3B规模的预训练及指令调优生成模型,针对多语言对话场景优化。
大型语言模型
Transformers

支持多种语言
L
meta-llama
1.6M
1,391
Llama 3.2 1B Instruct
Llama 3.2是Meta开发的多语言大语言模型系列,包含1B和3B规模的预训练及指令调优生成模型,针对多语言对话场景优化,支持智能检索和摘要任务。
大型语言模型
Transformers

支持多种语言
L
meta-llama
2.4M
901
Llama 3.2 1B
Llama 3.2是Meta推出的多语言大语言模型系列,包含1B和3B参数的预训练及指令调优生成模型,针对多语言对话场景优化,支持代理检索和摘要任务。
大型语言模型
Transformers

支持多种语言
L
meta-llama
2.1M
1,866
Llama 3.1 8B Instruct GGUF
Meta Llama 3.1 8B Instruct 是一个多语言大语言模型,针对多语言对话用例进行了优化,在常见的行业基准测试中表现优异。
大型语言模型
英语
L
modularai
9.7M
4
Llama 3.1 8B
Meta Llama 3.1 是一个多语言大语言模型系列,包含8B、70B和405B三种规模的预训练及指令调优生成模型,针对多语言对话场景优化。
大型语言模型
Transformers

支持多种语言
L
meta-llama
1.0M
1,583
Yarn Mistral 7B 128k AWQ
Apache-2.0
Yarn Mistral 7B 128K是一款针对长上下文优化的先进语言模型,通过YaRN扩展方法在长上下文数据上进一步预训练,支持128k令牌的上下文窗口。
大型语言模型
Transformers

英语
Y
TheBloke
483
72
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文