C

Codemodernbert Owl 3.0

由 Shuu12121 开发
CodeModernBERT-Owl-3.0 是 CodeModernBERT 系列中多语言长上下文编码器模型的最终预训练版本,针对代码搜索、代码摘要、错误修复和表示学习等下游代码相关任务进行了优化。
下载量 119
发布时间 : 6/20/2025

模型简介

该模型基于预训练检查点 CodeModernBERT-Owl-3.0-Pre 构建,并进一步进行了预训练,以更好地捕捉多种编程语言源代码中的结构模式和语义。

模型特点

长上下文窗口
支持 2048 个标记的上下文窗口,适合理解长代码。
多语言支持
在 8 种编程语言的 1120 万个函数上进行训练,支持多语言代码理解。
下游任务优化
针对代码搜索、语义嵌入、摘要和完形填空式错误修复等下游任务进行了微调。
高性能
在 CodeSearchNet 测试集的所有语言中实现了最高的 MRR,展示了出色的跨语言一致性。

模型能力

代码搜索
代码摘要
错误修复
表示学习
多语言代码理解

使用案例

代码搜索
跨语言代码搜索
使用模型嵌入进行跨语言的代码搜索任务。
在 CodeSearchNet 测试集上,MRR 达到 0.8814(Python)。
代码摘要
自动生成代码摘要
利用模型生成代码片段的自然语言摘要。
错误修复
完形填空式错误修复
使用模型的填充掩码功能进行代码错误修复。
AIbase
智启未来,您的人工智能解决方案智库
简体中文