C

Codebert Base Cd Ft

由 mchochlov 开发
这是一个基于sentence-transformers的模型,专门针对代码克隆检测任务进行了微调,能将代码片段映射到768维向量空间。
下载量 5,080
发布时间 : 8/16/2022
模型介绍
内容详情
替代品

模型简介

该模型基于CodeBERT架构,通过对比学习方法在BigCloneBench数据集上进行微调,主要用于代码相似度计算和克隆检测任务。

模型特点

代码专用嵌入
专门针对代码片段优化的向量表示,能更好捕捉代码语义特征
克隆检测优化
通过对比学习在BigCloneBench数据集上微调,特别适合代码克隆检测场景
高维语义表示
生成768维的密集向量,能有效表示代码的深层语义特征

模型能力

代码相似度计算
代码克隆检测
代码特征提取

使用案例

代码分析
代码克隆检测
识别不同代码片段之间的相似性,发现潜在的代码克隆
可有效检测Type-1到Type-4级别的代码克隆
代码搜索
通过语义相似度实现更精准的代码搜索
代码质量
重复代码识别
在大型代码库中识别重复或高度相似的代码片段
帮助减少代码冗余,提高维护性