C

Codet5p 2b

由 Salesforce 开发
CodeT5+是一个开源的代码大语言模型家族,支持代码理解与生成任务,采用编码器-解码器架构,可灵活切换不同工作模式。
下载量 745
发布时间 : 5/17/2023
模型介绍
内容详情
替代品

模型简介

CodeT5+是一个新型开源代码大语言模型家族,采用编码器-解码器架构,可灵活切换不同工作模式(包括纯编码器、纯解码器和编码解码器),支持广泛的代码理解与生成任务。

模型特点

灵活的工作模式
支持纯编码器、纯解码器和编码解码器三种工作模式,适应不同的代码理解与生成任务。
多样化的预训练任务
通过片段去噪、因果语言建模、对比学习和文本-代码匹配等多种预训练任务,从单模态代码数据和双模态代码-文本数据中学习丰富表征。
计算高效预训练
采用创新的计算高效预训练方法,通过冻结现成大语言模型组件进行高效扩展,支持20亿、60亿、160亿参数规模。
浅编码器-深解码器架构
采用浅编码器-深解码器架构,优化模型性能。

模型能力

代码理解
代码生成
文本-代码检索
行级代码补全
检索增强代码生成
数学编程

使用案例

代码生成
函数补全
根据函数签名自动补全函数体
在HumanEval基准的零样本文本-代码生成任务中表现优异
代码理解
代码检索
根据自然语言描述检索相关代码片段
在8个文本-代码检索任务上平均MRR提升3.2个点
数学编程
数学问题求解
将数学问题转化为可执行代码
在MathQA-Python和GSM8K-Python数学编程任务中表现优异