Openr1 Distill 7B
Apache-2.0
OpenR1-Distill-7B是基于Qwen2.5-Math-7B在Mixture-of-Thoughts数据集上后训练的版本,旨在教会语言模型进行逐步推理。
大型语言模型
Transformers

英语
O
open-r1
134
6
Avern 1.5 Mintra
MIT
Qwen2.5-Coder-7B-Instruct 是一个基于 Qwen2.5 架构的 7B 参数规模的代码生成模型,专注于指令微调,适用于代码生成和编程辅助任务。
大型语言模型
PyTorch
A
averntech
87
1
Nvidia.opencodereasoning Nemotron 14B GGUF
由NVIDIA开发的开源代码推理大语言模型,参数规模为140亿,专注于代码生成和推理任务。
大型语言模型
N
DevQuasar
423
2
Qwen2.5 Recursive Coder 14B Instruct
Apache-2.0
基于Qwen2.5架构的14B参数规模代码生成与理解模型,通过Model Stock方法融合多个专业编码模型而成
大型语言模型
Transformers

Q
spacematt
39
2
Deepcoder 14B Preview Exl2
DeepCoder-14B-Preview是基于DeepSeek-R1-Distill-Qwen-14B开发的代码生成模型,专注于可验证编程问题的解决。
大型语言模型
英语
D
cgus
46
2
Qwen2.5 CompositeFlow Coder 14B Instruct
Apache-2.0
基于Qwen2.5-Coder-14B-Instruct基础模型,通过mergekit工具合并多个专业编码模型的混合模型
大型语言模型
Transformers

Q
spacematt
31
3
Huihui Ai.deepseek V3 0324 Pruned Coder 411B GGUF
DeepSeek-V3-0324-Pruned-Coder-411B 是一个经过剪枝优化的代码生成模型,基于 DeepSeek-V3 架构,专注于代码生成任务。
大型语言模型
H
DevQuasar
2,706
2
Qwen2.5 Coder 32B YOYO
Qwen2.5-Coder-32B-instruct是基于Qwen2.5-Coder-32B的指令微调版本,专注于代码生成和理解任务。
大型语言模型
Transformers

Q
YOYO-AI
14
2
EXAONE Deep 2.4B AWQ
其他
EXAONE Deep系列模型在数学和编程等推理任务中表现出色,本模型为24亿参数的AWQ量化版本
大型语言模型
Transformers

支持多种语言
E
LGAI-EXAONE
751
16
Qwen2.5 Coder 0.5B Q8 0 GGUF
Apache-2.0
这是一个基于Qwen2.5-Coder-0.5B模型转换的GGUF格式模型,适用于代码生成任务。
大型语言模型
支持多种语言
Q
ggml-org
943
5
Codellama 7b Python Hf
Code Llama是由Meta开发的70亿参数代码生成模型系列,本版本专门针对Python语言优化
大型语言模型
Transformers

其他
C
meta-llama
2,271
22
Tinyllama 1.1B Chat V1.0 Sql Create Context Mlx
Apache-2.0
这是一个基于TinyLlama-1.1B-Chat-v1.0微调的模型,专门用于将自然语言问题及表结构定义(DDL)转换为SQL查询语句。
大型语言模型
Transformers

英语
T
alwint3r
57
1
Whiterabbitneo 7B V1.5a
其他
WhiteRabbitNeo系列模型专注于网络安全领域的攻防应用,当前版本为7B参数规模,具备代码生成和分析能力。
大型语言模型
Transformers

W
WhiteRabbitNeo
74
50
Starling LM 7B Alpha
Apache-2.0
首个基于AI反馈强化学习(RLAIF)训练的开源大语言模型,在MT Bench测试中表现优异
大型语言模型
Transformers

英语
S
berkeley-nest
9,765
558
Openchat 3.5
Apache-2.0
OpenChat是一个创新的开源语言模型库,采用C-RLFT策略进行微调,即使仅有70亿参数也能实现与ChatGPT相媲美的性能。
大型语言模型
Transformers

O
openchat
14.35k
1,127
Codefuse 13B
其他
CodeFuse-13B是基于GPT-NeoX框架训练的130亿参数代码生成模型,支持40多种编程语言,能处理长达4096字符的代码序列。
大型语言模型
Transformers

C
codefuse-ai
31
49
Wizardcoder Python 13B V1.0
WizardCoder是通过Evol-Instruct方法增强的代码大语言模型,专注于代码生成任务。
大型语言模型
Transformers

其他
W
WizardLMTeam
681
106
Codellama 34B Instruct GGUF
CodeLlama 34B Instruct是Meta基于Llama 2架构开发的大型代码生成模型,专门针对编程任务进行了优化,支持多种编程语言。
大型语言模型
其他
C
TheBloke
8,348
97
Codellama 13B GGUF
CodeLlama 13B 是 Meta 发布的代码生成与理解模型,基于 Llama 2 架构,专门针对编程任务优化。
大型语言模型
其他
C
TheBloke
8,068
61
Codellama 7B GGUF
CodeLlama 7B是由Meta开发的7B参数规模的代码生成与理解模型,基于Llama 2架构优化,专注于编程任务。
大型语言模型
其他
C
TheBloke
10.80k
121
Codellama 13b Hf
Code Llama 13B是一个130亿参数的生成式代码模型,专为通用代码合成与理解设计
大型语言模型
Transformers

其他
C
codellama
6,829
107
Wizardcoder 15B V1.0
Openrail
WizardCoder-33B-V1.1是基于deepseek-coder-33b-base训练的开源代码大语言模型,在HumanEval等代码生成基准测试中表现优异。
大型语言模型
Transformers

其他
W
WizardLMTeam
521
759
Codet5 Small Custom Functions Dataset Python
Apache-2.0
基于Salesforce/codet5-small微调的Python代码生成模型,专注于自定义函数生成任务
大型语言模型
Transformers

C
sharoz
43
1
Codegen 350M Mono Custom Functions Dataset Python V2
Bsd-3-clause
基于Salesforce/codegen-350M-mono微调的Python代码生成模型,专注于自定义函数生成
大型语言模型
Transformers

C
sharoz
130
2
Gpt Neo 125M Code Clippy Dedup 2048
基于GPT-Neo架构的125M参数代码生成模型,针对CodeClippy数据集进行微调,支持2048长度的序列生成
大型语言模型
G
flax-community
1,528
14
Codeparrot
CodeParrot 是一个基于GPT-2架构(15亿参数)训练的Python代码生成模型,专注于Python代码的自动生成。
大型语言模型
Transformers

其他
C
codeparrot
1,342
105
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文