C

Codesearch ModernBERT Crow Plus

由 Shuu12121 开发
基于ModernBERT架构优化的多语言代码搜索模型,支持自然语言与代码间的语义匹配
下载量 96
发布时间 : 4/25/2025
模型介绍
内容详情
替代品

模型简介

该模型是针对多语言代码搜索任务优化的句子转换器模型,能够高效捕捉自然语言查询与多种编程语言代码片段之间的语义相似性

模型特点

多语言代码支持
支持Python、Java、JavaScript、PHP、Ruby、Go、Rust等多种编程语言的代码搜索
高精度语义匹配
在MTEB代码搜索任务中取得nDCG@10 0.893的优异成绩,排名前8/146
函数级代码理解
专门针对函数级代码片段优化,能精准匹配语义相似的代码实现
日语查询支持
通过集成Qwen3-8B-FP8翻译模型,支持日语自然语言查询转换为英语搜索

模型能力

自然语言到代码搜索
代码到代码相似性比较
多语言代码特征提取
函数级代码语义分析

使用案例

代码搜索系统
GitHub仓库函数级搜索
构建针对GitHub仓库的函数级代码搜索系统,支持自然语言查询
首次创建索引后可快速复用,支持高精度语义搜索
开发辅助工具
代码推荐
根据开发者的自然语言描述推荐相似代码实现
代码复用检测
识别项目中语义相似但实现不同的代码片段