C

Codesearch ModernBERT Snake

由 Shuu12121 开发
专为代码搜索设计的句子转换器模型,基于ModernBERT架构,支持8192标记长序列处理
下载量 36
发布时间 : 3/26/2025
模型介绍
内容详情
替代品

模型简介

该模型专注于计算代码片段与文档之间的语义相似度,适用于代码搜索任务。基于Shuu12121/CodeModernBERT-Snake微调而来,具有处理超长代码序列的能力。

模型特点

超长序列处理
支持最大8192个标记的序列长度,能处理极长的代码片段和文档
高效代码搜索
专为代码搜索优化,能高效计算代码与文档之间的语义相似度
紧凑模型尺寸
仅7500万参数的小型模型,性能却与更大模型相当

模型能力

代码语义嵌入生成
代码-文档相似度计算
长代码序列处理

使用案例

代码搜索与检索
代码片段搜索
根据自然语言查询搜索相关代码片段
在CodeSearchNet基准测试中获得72.12分
文档-代码匹配
自动匹配代码片段与其对应的文档描述