Deepseek Coder V2 Base
其他
DeepSeek-Coder-V2 是一个专注于编程和代码任务的AI助手,擅长编写、调试和解释多种编程语言的代码。
大型语言模型
Transformers

D
deepseek-ai
4,588
71
Minitron 8B Base
其他
Minitron-8B-Base是通过剪裁Nemotron-4 15B获得的大型语言模型,采用蒸馏持续训练方法,相比从头训练节省了40倍的训练token和1.8倍的计算成本。
大型语言模型
Transformers

英语
M
nvidia
5,725
66
Codegemma 7b It
CodeGemma是基于Gemma构建的轻量级开源代码模型集合,专长于代码生成、补全和对话任务。
大型语言模型
Transformers

C
google
3,286
217
Wizardcoder 33B V1.1
WizardCoder-33B-V1.1是基于deepseek-coder-33b-base训练的开源代码大语言模型,在HumanEval和MBPP等基准测试上表现优异,成为SOTA开源代码LLM。
大型语言模型
Transformers

其他
W
WizardLMTeam
293
133
Codellama 34B Instruct GPTQ
CodeLlama 34B 指导版是Meta发布的340亿参数代码生成模型,基于Llama 2架构,专门针对编程任务进行微调。
大型语言模型
Transformers

其他
C
TheBloke
174
75
Diff Codegen 350m V2
MIT
由CarperAI发布的用于代码生成的差异模型,专注于根据自然语言描述智能修改现有代码
大型语言模型
Transformers

支持多种语言
D
CarperAI
86
16
Codereviewer
Apache-2.0
CodeReviewer是一个通过代码变更和代码审查数据进行预训练的模型,旨在支持代码审查任务。
大型语言模型
Transformers

其他
C
microsoft
1,169
137
Gpt Neo 1.3B Apps All 2
MIT
基于GPT-Neo-1.3B模型在APPS数据集上微调而成的编程任务解决模型
大型语言模型
G
flax-community
15
2
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文