C

Codemodernbert Owl

由 Shuu12121 开发
CodeModernBERT-Owl 是一个从头预训练的模型,专为代码检索与代码理解任务设计,支持多种编程语言并提升检索准确率。
下载量 285
发布时间 : 3/12/2025

模型简介

专为代码检索、代码理解及代码克隆检测优化的高精度模型,新增支持Rust语言并提升多种语言的检索准确率。

模型特点

长序列处理
支持长达2048标记的序列处理,优于微软模型的512标记限制
多语言支持
支持Python、PHP、Java、JavaScript、Go、Ruby及Rust等多种编程语言
高准确率
在代码检索任务中实现CodeHawks/CodeMorph系列最高准确率
数据增强
通过GitHub开源仓库微调提升Java和Rust语言的检索准确率

模型能力

代码检索
代码理解
代码克隆检测
多语言代码处理

使用案例

代码检索
跨语言代码搜索
在不同编程语言中搜索相似的代码片段
在Python、Java等语言中检索准确率超过0.85
代码理解
代码功能分析
理解代码的功能和逻辑
AIbase
智启未来,您的人工智能解决方案智库
简体中文