N

Nomic Embed Code GGUF

由 nomic-ai 开发
Nomic代码嵌入模型是一款顶尖的代码检索工具,支持多种编程语言,擅长代码检索任务。
下载量 1,300
发布时间 : 4/30/2025
模型介绍
内容详情
替代品

模型简介

Nomic代码嵌入模型是一款高性能的代码检索工具,支持多种编程语言,包括Python、Java、Ruby、PHP、JavaScript和Go。该模型通过量化技术优化,适用于代码检索和特征提取任务。

模型特点

高性能代码检索
在CodeSearchNet上超越Voyage Code 3和OpenAI Embed 3 Large,表现优异。
多语言支持
支持多种编程语言,包括Python、Java、Ruby、PHP、JavaScript和Go。
先进架构
采用7B参数的代码嵌入模型,通过双重一致性过滤和渐进式困难负样本挖掘训练。
完全开源
公开模型权重、训练数据和评估代码,便于研究和应用。

模型能力

代码检索
句子相似度计算
特征提取

使用案例

代码检索
RAG应用中的代码检索
在RAG(检索增强生成)应用中,使用该模型检索与用户问题相关的代码片段。
能够准确检索到与查询相关的代码片段,如计算阶乘的函数。
代码相似度分析
代码相似度比较
比较不同代码片段之间的相似度,用于代码克隆检测或代码推荐。
能够准确计算代码片段之间的相似度,区分不同功能的代码。