S

Starcoder

由 bigcode 开发
StarCoder是一个基于80多种编程语言训练的15.5B参数代码生成模型,支持8192个token的上下文窗口
下载量 10.72k
发布时间 : 4/24/2023

模型简介

StarCoder是一个强大的代码生成模型,基于The Stack数据集训练,能够生成多种编程语言的代码片段。它采用多查询注意力机制和填充中间目标技术,在1万亿token上进行训练。

模型特点

大上下文窗口
支持8192个token的上下文窗口,适合处理长代码片段
多语言支持
基于80多种编程语言训练,包括Python、Java、C++等主流语言
填充中间生成
支持填充中间(FIM)技术,可以补全代码中的缺失部分
高性能
在HumanEval等基准测试中表现出色,pass@1得分达到0.408

模型能力

代码自动补全
代码片段生成
多语言代码转换
代码文档生成
代码错误修复

使用案例

软件开发
函数生成
根据函数签名自动生成实现代码
在HumanEval测试中pass@1得分0.336
代码补全
在IDE中提供智能代码补全建议
教育
编程学习辅助
为学生生成示例代码或解释编程概念
AIbase
智启未来,您的人工智能解决方案智库
简体中文