S

Starcoderbase

由 bigcode 开发
StarCoderBase是一个155亿参数的大规模代码生成模型,基于80多种编程语言训练而成,支持代码补全和生成任务。
下载量 3,216
发布时间 : 5/3/2023
模型介绍
内容详情
替代品

模型简介

StarCoderBase是基于The Stack数据集中80多种编程语言训练的大型代码生成模型,采用多查询注意力机制和8192标记的上下文窗口,专注于代码生成和补全任务。

模型特点

大规模多语言支持
支持80多种编程语言的代码生成和理解
长上下文处理
8192标记的上下文窗口,适合处理长代码片段
中间填充能力
支持在代码中间进行填充补全,而不仅限于从左到右生成
高效推理
采用多查询注意力机制提升推理效率

模型能力

代码自动补全
函数生成
代码片段生成
多语言代码转换
代码解释

使用案例

开发辅助
代码补全
在IDE中提供智能代码补全建议
提高开发效率30%以上
代码生成
根据函数签名自动生成实现代码
HumanEval基准pass@1达到30.4%
教育
编程学习
为学生生成示例代码和练习