gpt-neo-125M-code-search-py开源模型 - 免费支持Python代码方法自动补全

首页

Gpt Neo 125M Code Search Py

由 flax-community 开发

基于GPT-Neo-125M微调的Python代码自动补全模型，专注于方法补全任务

大型语言模型 #Python代码补全 #方法级生成 #小参数高效

下载量 17

发布时间 : 3/2/2022

模型简介

该模型是在CodeSearchNet挑战数据集的Python语言部分上进行微调的因果语言模型，专门用于根据方法签名和文档字符串自动补全Python方法。

模型特点

Python代码专注

专门针对Python语言进行优化，特别擅长方法级别的代码补全

基于GPT-Neo架构

建立在强大的GPT-Neo-125M模型基础上，继承了其语言理解能力

方法签名理解

能够根据方法签名和文档字符串生成符合上下文的代码实现

模型能力

Python代码生成

方法自动补全

代码理解

文档字符串到代码转换

使用案例

开发辅助

IDE插件

集成到开发环境中提供实时代码补全建议

提高Python开发效率

代码片段生成

根据方法描述生成初步实现代码

快速原型开发

教育

编程学习辅助

帮助学生理解如何将需求转化为代码实现

增强学习效果

🚀 GPT-Code-Clippy-125M-Code-Search-Py

GPT-Code-Clippy-125M-Code-Search-Py 是一个专门用于 Python 代码自动补全的模型，基于 GPT-Neo-125M 模型微调而来，能有效提升 Python 代码编写的效率。

⚠️ 重要提示

请参考我们新的 GitHub Wiki，其中详细记录了我们创建 GitHub Copilot 开源版本的工作。

📚 详细文档

模型描述

GPT-CC-125M-Code-Search 是一个 GPT-Neo-125M 模型，它在 CodeSearchNet Challenge 数据集上仅针对 Python 语言使用因果语言建模进行了微调。该模型专门用于自动补全 Python 语言中的方法。

训练数据

CodeSearchNet Challenge 数据集。

训练过程

用于训练此模型的训练脚本可以在这里找到。

./run_clm_flax.py \
    --output_dir $HOME/gpt-neo-125M-code-search-py \
    --model_name_or_path="EleutherAI/gpt-neo-125M" \
    --dataset_name code_search_net \
    --dataset_config_name="python" \
    --do_train --do_eval \
    --block_size="512" \
    --per_device_train_batch_size="32" \
    --per_device_eval_batch_size="64" \
    --preprocessing_num_workers="8" \
    --learning_rate="1.2e-4" \
    --num_train_epochs 20 \
    --warmup_steps 3000 \
    --adam_beta1="0.9" \
    --adam_beta2="0.95" \
    --weight_decay="0.1" \
    --overwrite_output_dir \
    --logging_steps="25" \
    --eval_steps="500" \
    --push_to_hub="False" \
    --report_to="all" \
    --dtype="bfloat16" \
    --skip_memory_metrics="True" \
    --save_steps="500" \
    --save_total_limit 10 \
    --report_to="wandb" \
    --run_name="gpt-neo-125M-code-search-py"

预期用途和限制

使用方法

你可以直接使用文本生成管道来使用此模型。此示例每次运行时都会生成不同的序列：

from transformers import AutoModelForCausalLM, AutoTokenizer, FlaxAutoModelForCausalLM

model = AutoModelForCausalLM.from_pretrained("flax-community/gpt-neo-125M-code-clippy-code-search-py")

tokenizer = AutoTokenizer.from_pretrained("flax-community/gpt-neo-125M-code-clippy-code-search-py")

prompt = """def greet(name):
  '''A function to greet user. Given a user name it should say hello'''
""" 

input_ids = tokenizer(prompt, return_tensors='pt').input_ids.to(device)

start = input_ids.size(1)

out = model.generate(input_ids, do_sample=True, max_length=50, num_beams=2, 

                     early_stopping=True, eos_token_id=tokenizer.eos_token_id, )

print(tokenizer.decode(out[0][start:]))