D

Deepcoder 1.5B Preview AWQ

由 adriabama06 开发
DeepCoder-1.5B-Preview是一款基于代码推理的大型语言模型,通过分布式强化学习从DeepSeek-R1-Distilled-Qwen-1.5B微调而来,能够处理更长的上下文长度。
下载量 72
发布时间 : 4/13/2025

模型简介

DeepCoder-1.5B-Preview是一款专注于代码推理的大型语言模型,通过改进的GRPO+训练方法和迭代上下文延长技术,提升了长上下文处理能力。

模型特点

强化学习微调
采用改进版GRPO+算法进行微调,结合DAPO的见解实现更稳定的训练
长上下文处理
通过迭代上下文延长技术,支持64K上下文长度的推理
4位量化
采用AWQ 4位128g量化技术,提高推理效率
开放许可
采用MIT许可证,促进AI技术的民主化

模型能力

代码生成
长上下文理解
编程问题解答
代码推理

使用案例

编程辅助
编程问题解答
解决各类编程竞赛和面试中的算法问题
在LiveCodeBench(v5)上达到25.1%准确率
代码生成
根据自然语言描述生成功能代码
HumanEval+得分73.0
教育
编程学习辅助
帮助学生理解和解决编程练习
AIbase
智启未来,您的人工智能解决方案智库
简体中文