starcoder2-15b-instruct-v0.1开源代码大模型 - 免费部署响应单轮编程指令

首页

Starcoder2 15b Instruct V0.1

由 bigcode 开发

首个完全通过开放透明流程训练的自对齐代码大语言模型，专为单轮编程指令响应设计

大型语言模型

Transformers

其他开源协议:Openrail #自对齐代码生成 #Python编程助手 #执行验证优化

下载量 1,371

发布时间 : 4/23/2024

模型简介

StarCoder2-15B-Instruct是通过StarCoder2-15B自身生成的指令-响应对进行微调得到的代码生成模型，全程无需人工标注或闭源模型蒸馏数据

模型特点

完全透明的自对齐流程

使用StarCoder2自身生成训练数据，不依赖人工标注或闭源模型蒸馏

执行验证的数据过滤

通过实际执行验证生成的代码响应，确保训练数据质量

开放源代码和数据

完整公开训练流程、代码库和数据集

高性能代码生成

在HumanEval、MBPP等基准测试上表现优异

模型能力

Python代码生成

带类型提示的代码生成

代码补全

算法实现

函数生成

使用案例

编程辅助

算法实现

根据自然语言描述生成算法实现代码

在HumanEval基准上达到72.6% pass@1

代码补全

根据函数签名或部分代码生成完整实现

在MBPP基准上达到75.2% pass@1

教育

编程教学

生成教学示例代码和练习

🚀 StarCoder2-Instruct：用于代码生成的完全透明且许可宽松的自对齐模型

StarCoder2-Instruct是一款用于代码生成的模型，它采用了完全透明且许可宽松的自对齐训练方式，能在代码生成任务中提供高效准确的输出。

✨ 主要特性

我们推出了StarCoder2-15B-Instruct-v0.1，这是首个使用完全许可宽松且透明的管道进行训练的完全自对齐代码大语言模型（LLM）。我们的开源管道使用StarCoder2-15B生成数千个指令 - 响应对，然后用于微调StarCoder-15B本身，无需任何人工注释或来自大型专有LLM的蒸馏数据。

模型：bigcode/starcoder2-15b-instruct-v0.1
代码：bigcode-project/starcoder2-self-align
数据集：bigcode/self-oss-instruct-sc2-exec-filter-50k
作者： Yuxiang Wei、 Federico Cassano、 Jiawei Liu、 Yifeng Ding、 Naman Jain、 Harm de Vries、 Leandro von Werra、 Arjun Guha、 Lingming Zhang。

self-alignment pipeline

📚 详细文档

引用

@article{wei2024selfcodealign,
  title={SelfCodeAlign: Self-Alignment for Code Generation}, 
  author={Yuxiang Wei and Federico Cassano and Jiawei Liu and Yifeng Ding and Naman Jain and Zachary Mueller and Harm de Vries and Leandro von Werra and Arjun Guha and Lingming Zhang},
  year={2024},
  journal={arXiv preprint arXiv:2410.24198}
}

使用说明

预期用途

该模型旨在单轮响应与编码相关的指令。其他风格的指令可能会导致响应准确性降低。

以下是使用transformers库开始使用该模型的示例：

import transformers
import torch

pipeline = transformers.pipeline(
    model="bigcode/starcoder2-15b-instruct-v0.1",
    task="text-generation",
    torch_dtype=torch.bfloat16,
    device_map="auto",
)

def respond(instruction: str, response_prefix: str) -> str:
    messages = [{"role": "user", "content": instruction}]
    prompt = pipeline.tokenizer.apply_chat_template(messages, tokenize=False)
    prompt += response_prefix

    teminators = [
        pipeline.tokenizer.eos_token_id,
        pipeline.tokenizer.convert_tokens_to_ids("###"),
    ]

    result = pipeline(
        prompt,
        max_length=256,
        num_return_sequences=1,
        do_sample=False,
        eos_token_id=teminators,
        pad_token_id=pipeline.tokenizer.eos_token_id,
        truncation=True,
    )
    response = response_prefix + result[0]["generated_text"][len(prompt) :].split("###")[0].rstrip()
    return response


instruction = "Write a quicksort function in Python with type hints and a 'less_than' parameter for custom sorting criteria."
response_prefix = ""

print(respond(instruction, response_prefix))

以下是预期输出：

Here's how you can implement a quicksort function in Python with type hints and a 'less_than' parameter for custom sorting criteria:

```python
from typing import TypeVar, Callable

T = TypeVar('T')

def quicksort(items: list[T], less_than: Callable[[T, T], bool] = lambda x, y: x < y) -> list[T]:
    if len(items) <= 1:
        return items

    pivot = items[0]
    less = [x for x in items[1:] if less_than(x, pivot)]
    greater = [x for x in items[1:] if not less_than(x, pivot)]
    return quicksort(less, less_than) + [pivot] + quicksort(greater, less_than)
```

偏差、风险和局限性

StarCoder2-15B-Instruct-v0.1主要针对可通过执行验证的Python代码生成任务进行微调，这可能会导致某些偏差和局限性。例如，模型可能不会严格遵循规定输出格式的指令。在这些情况下，提供响应前缀或单样本示例来引导模型输出是有益的。此外，该模型在其他编程语言和领域外的编码任务上可能存在局限性。

该模型还继承了其基础模型StarCoder2-15B的偏差、风险和局限性。更多信息，请参考StarCoder2-15B模型卡片。

评估结果

EvalPlus LiveCodeBench and DS-1000

训练细节

超参数

属性	详情
优化器	Adafactor
学习率	1e - 5
轮数	4
批量大小	64
热身比例	0.05
调度器	线性
序列长度	1280
丢弃率	未应用

硬件

1 x NVIDIA A100 80GB

资源

模型：bigcode/starCoder2-15b-instruct-v0.1
代码：bigcode-project/starcoder2-self-align
数据集：bigcode/self-oss-instruct-sc2-exec-filter-50k

完整数据管道

我们的数据集生成管道有几个步骤。我们为管道的每个步骤提供中间数据集：

从The Stack v1过滤的原始种子数据集：https://huggingface.co/datasets/bigcode/python-stack-v1-functions-filtered
使用StarCoder2-15B作为判断器过滤掉带有不良文档字符串的项目的种子数据集：https://huggingface.co/datasets/bigcode/python-stack-v1-functions-filtered-sc2
种子 -> 概念：https://huggingface.co/datasets/bigcode/self-oss-instruct-sc2-concepts
概念 -> 指令：https://huggingface.co/datasets/bigcode/self-oss-instruct-sc2-instructions
指令 -> 响应：https://huggingface.co/datasets/bigcode/self-oss-instruct-sc2-responses-unfiltered
通过执行过滤的响应：https://huggingface.co/datasets/bigcode/self-oss-instruct-sc2-exec-filter-500k-raw
通过去重过滤的执行响应（最终数据集）：https://huggingface.co/datasets/bigcode/self-oss-instruct-sc2-exec-filter-50k