C

Codebert Base Mlm

由 microsoft 开发
CodeBERT是一个面向编程语言与自然语言的预训练模型,基于RoBERTa架构,采用掩码语言建模(MLM)目标训练。
下载量 8,848
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型专门针对代码理解和生成任务设计,能够处理编程语言与自然语言的交互场景。

模型特点

双模态预训练
同时学习编程语言和自然语言的表示
基于RoBERTa优化
采用改进的RoBERTa架构,在代码理解任务上表现优异
大规模代码训练
基于CodeSearchNet代码语料库训练,覆盖多种编程语言

模型能力

代码补全
代码理解
代码搜索
文档生成

使用案例

代码开发
代码自动补全
预测代码中的缺失部分
示例显示能准确预测逻辑运算符(如and/or)
代码搜索
根据自然语言查询匹配相关代码片段
文档生成
代码注释生成
为代码生成解释性注释