C

Codet5p 220m

由 Salesforce 开发
CodeT5+ 是一个开源的代码大语言模型家族,采用编码器-解码器架构,支持多种模式,适用于广泛的代码理解与生成任务。
下载量 12.98k
发布时间 : 5/13/2023
模型介绍
内容详情
替代品

模型简介

CodeT5+ 是一个面向代码理解与生成的开源代码大语言模型,支持多种编程语言和任务。

模型特点

多样化的预训练任务
通过片段去噪、因果语言建模、对比学习和文本-代码匹配等多种预训练任务学习丰富表征。
计算高效预训练
利用现成的大型语言模型冻结初始化模型组件,高效扩展模型规模。
灵活支持多种模式
支持仅编码器、仅解码器和编码器-解码器三种模式,适用于广泛的代码任务。

模型能力

代码生成
代码理解
文本到代码检索
行级代码补全
检索增强代码生成
数学编程

使用案例

代码生成
函数补全
根据函数签名自动补全函数体
在HumanEval基准测试中达到35.0%的pass@1
代码理解
文本到代码检索
根据自然语言描述检索相关代码片段
在8个文本到代码检索任务中平均MRR提升+3.2