函数调用支持
Deepseek R1 0528
MIT
DeepSeek R1模型已完成小幅版本升级,当前版本为DeepSeek-R1-0528。
大型语言模型
Transformers
D
deepseek-ai
4,556
1,249
Kanana 1.5 8b Instruct 2505
Apache-2.0
Kanana 1.5是Kanana模型家族的新版本,在编码、数学和函数调用能力方面相比前代有显著提升,支持32K tokens长度并可扩展至128K tokens。
大型语言模型
Transformers
支持多种语言
K
kakaocorp
1,932
26
Qwen3 30B A3B Quantized.w4a16
Apache-2.0
Qwen3-30B-A3B的INT4量化版本,通过权重量化减少75%的磁盘和GPU内存需求,保持高性能。
大型语言模型
Transformers
Q
RedHatAI
379
2
Qwen3 32B Quantized.w4a16
Apache-2.0
Qwen3-32B的INT4量化版本,通过权重量化减少75%的磁盘和GPU内存需求,保持高性能
大型语言模型
Transformers
Q
RedHatAI
2,213
5
Qwen3 8B FP8 Dynamic
Apache-2.0
Qwen3-8B-FP8-dynamic是基于Qwen3-8B模型通过FP8量化优化的版本,显著降低了GPU内存需求和磁盘空间占用,同时保持了原始模型的性能。
大型语言模型
Transformers
Q
RedHatAI
81
1
Qwen3 32B FP8 Dynamic
Apache-2.0
基于Qwen3-32B进行FP8动态量化的高效语言模型,显著降低内存需求并提升计算效率
大型语言模型
Transformers
Q
RedHatAI
917
8
Trendyol LLM 7B Chat V4.1.0
Apache-2.0
Trendyol LLM v4.1.0 是一款基于 Trendyol LLM base v4.0(在130亿token上继续预训练的Qwen2.5 7B版本)的生成模型,专注于电商领域和土耳其语理解。
大型语言模型
其他
T
Trendyol
854
25
Deephermes 3 Llama 3 3B Preview
DeepHermes 3 预览版是 Nous Research 旗舰 Hermes 系列大语言模型的最新版本,结合了推理和普通响应模式,改进了注释、判断和函数调用功能。
大型语言模型
Transformers
英语
D
NousResearch
4,285
28
Lake 1 Advanced
MIT
Mistral-7B-Instruct-v0.3是基于Mistral-7B-v0.3进行指令微调的大语言模型,支持函数调用和扩展词汇表。
大型语言模型
L
BICORP
62
2
Hermes 3 Llama 3.2 3B Abliterated
Hermes 3 3B 是 Nous Research 的 Hermes 系列 LLM 中一个虽小但强大的新成员,专注于将 LLM 与用户对齐,赋予最终用户强大的引导和控制能力。
大型语言模型
Transformers
英语
H
lunahr
33
5
Deepseek V2.5
其他
DeepSeek-V2.5 是深度求索公司推出的一款高性能大语言模型,支持多种自然语言处理任务。
大型语言模型
Transformers
D
deepseek-ai
1,764
706
Minicpm3 4B
Apache-2.0
MiniCPM3-4B是MiniCPM系列第三代模型,整体性能超越Phi-3.5-mini-Instruct和GPT-3.5-Turbo-0125,与近期多个7B~9B量级模型表现相当。
大型语言模型
Transformers
支持多种语言
M
openbmb
15.94k
414
Mistral Nemo Instruct 2407
Apache-2.0
Mistral-Nemo-Instruct-2407是基于Mistral-Nemo-Base-2407进行指令微调的大语言模型,由Mistral AI与NVIDIA联合训练,性能超越同规模或更小的现有模型。
大型语言模型
Transformers
支持多种语言
M
mistralai
149.79k
1,519
Codegeex4 All 9b
其他
CodeGeeX4-ALL-9B是CodeGeeX4系列模型的最新开源版本,基于GLM-4-9B持续训练,显著提升了代码生成能力。
大型语言模型
Transformers
支持多种语言
C
THUDM
294
251
Mistral Coreml
Apache-2.0
Mistral-7B-Instruct-v0.3 是 Mistral AI 基于 Mistral-7B-v0.3 进行指令微调的版本,已转换为 CoreML 格式,提供 FP16 和 Int4 两种精度版本。
大型语言模型
M
apple
110
65
Mistral 7B Instruct V0.3 AWQ
Apache-2.0
Mistral-7B-Instruct-v0.3是基于Mistral-7B-v0.3进行指令微调的大语言模型,采用4位AWQ量化技术优化推理效率
大型语言模型
Transformers
M
solidrust
48.24k
3
Mistral 7B Instruct V0.3 GGUF
Apache-2.0
Mistral-7B-Instruct-v0.3 是基于 Mistral-7B-v0.3 进行指令微调的大型语言模型,支持函数调用和扩展词汇表。
大型语言模型
M
SanctumAI
34.61k
9
Mistral 7B Instruct V0.3 GPTQ
Apache-2.0
Mistral-7B-Instruct-v0.3是基于Mistral-7B-v0.3进行指令微调的大语言模型,提供了GPTQ 4位量化版本
大型语言模型
Transformers
M
thesven
1,391
1
Mistral 7B Instruct V0.3
Apache-2.0
Mistral-7B-Instruct-v0.3 是基于 Mistral-7B-v0.3 进行指令微调的大型语言模型,支持函数调用和扩展词汇表。
大型语言模型
Transformers
M
mistralai
709.57k
1,652
Llama3 70B Chinese Chat
Llama3-70B-Chinese-Chat是基于Meta-Llama-3-70B-Instruct开发的中英文双语大语言模型,专为中英文用户设计,具备角色扮演、工具使用和数学计算等多种能力。
大型语言模型
Transformers
支持多种语言
L
shenzhi-wang
58
102
Llama3 8B Chinese Chat GGUF F16
基于Meta-Llama-3-8B-Instruct微调的中英文双语对话模型,优化了中文回答质量,支持角色扮演和函数调用
大型语言模型
支持多种语言
L
shenzhi-wang
199
28
Llama3 8B Chinese Chat
基于Meta-Llama-3-8B-Instruct微调的中英文对话模型,优化了中文回答质量,减少中英文混杂问题。
大型语言模型
Transformers
支持多种语言
L
shenzhi-wang
2,777
678
Meta Llama 3 8B Instruct Function Calling Json Mode
该模型基于 meta-llama/Meta-Llama-3-8B-Instruct 进行了微调,专门用于函数调用和 JSON 模式。
大型语言模型
Transformers
英语
M
hiieu
188
75
Mixtral 8x22B Instruct V0.1
Apache-2.0
Mixtral-8x22B-Instruct-v0.1是基于Mixtral-8x22B-v0.1进行指令微调的大语言模型,支持多种语言和函数调用功能。
大型语言模型
Transformers
支持多种语言
M
mistralai
12.80k
723
Matter 0.1 7B Boost GGUF
Apache-2.0
Matter 7B是基于Mistral 7B微调的模型,专为文本生成任务设计,支持对话式交互和函数调用。
大型语言模型
英语
M
munish0838
170
1
Matter 0.1 7B GGUF
Apache-2.0
Matter 7B是基于Mistral 7B微调的模型,专为文本生成任务设计,支持对话式交互和函数调用。
大型语言模型
英语
M
munish0838
127
1