G

Gpt Neo 125M Code Clippy Dedup 2048

由 flax-community 开发
基于GPT-Neo架构的125M参数代码生成模型,针对CodeClippy数据集进行微调,支持2048长度的序列生成
下载量 1,528
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是GPT-Neo的小型版本,专门针对代码生成任务进行优化,适用于编程辅助场景

模型特点

长序列支持
支持2048长度的序列生成,适合处理较长的代码片段
代码优化
针对CodeClippy数据集进行专门微调,提升代码生成能力
保守训练策略
采用较大批量与较低学习率配合长预热期,保留预训练模型知识

模型能力

代码生成
文本补全
编程辅助

使用案例

编程开发
代码自动补全
根据已有代码上下文生成后续代码片段
编程问题解答
基于自然语言描述生成对应代码解决方案