🚀 nomic-embed-code模型
本项目基于nomic-ai/nomic-embed-code
基础模型,提供了多种量化版本的模型文件,可用于句子嵌入、特征提取等任务。
🚀 快速开始
若你不确定如何使用GGUF文件,请参考TheBloke的README获取更多详细信息,包括如何拼接多部分文件。
✨ 主要特性
- 多数据集支持:使用了多个编程语言相关的数据集进行训练,包括Python、JavaScript、Java、Go、PHP和Ruby。
- 多语言支持:支持英文。
- 多种量化版本:提供了多种不同大小和质量的量化版本供选择。
📦 模型信息
属性 |
详情 |
基础模型 |
nomic-ai/nomic-embed-code |
训练数据集 |
nomic-ai/cornstack-python-v1、nomic-ai/cornstack-javascript-v1、nomic-ai/cornstack-java-v1、nomic-ai/cornstack-go-v1、nomic-ai/cornstack-php-v1、nomic-ai/cornstack-ruby-v1 |
支持语言 |
英文 |
库名称 |
transformers |
许可证 |
apache-2.0 |
量化者 |
mradermacher |
标签 |
sentence-transformers、sentence-similarity、feature-extraction |
📚 详细文档
关于模型
本模型是对https://huggingface.co/nomic-ai/nomic-embed-code的加权/矩阵量化版本。静态量化版本可在https://huggingface.co/mradermacher/nomic-embed-code-GGUF获取。
你可以访问此模型的模型页面查看便捷的概述和下载列表。
提供的量化版本
(按大小排序,不一定代表质量。IQ量化版本通常优于类似大小的非IQ量化版本)
链接 |
类型 |
大小/GB |
备注 |
GGUF |
i1-IQ1_S |
1.8 |
适用于急需的情况 |
GGUF |
i1-IQ1_M |
2.0 |
大多用于急需情况 |
GGUF |
i1-IQ2_XXS |
2.2 |
|
GGUF |
i1-IQ2_XS |
2.4 |
|
GGUF |
i1-IQ2_S |
2.5 |
|
GGUF |
i1-IQ2_M |
2.6 |
|
GGUF |
i1-Q2_K_S |
2.8 |
质量非常低 |
GGUF |
i1-Q2_K |
2.9 |
IQ3_XXS可能更好 |
GGUF |
i1-IQ3_XXS |
3.0 |
质量较低 |
GGUF |
i1-IQ3_XS |
3.2 |
|
GGUF |
i1-Q3_K_S |
3.4 |
IQ3_XS可能更好 |
GGUF |
i1-IQ3_S |
3.4 |
优于Q3_K* |
GGUF |
i1-IQ3_M |
3.4 |
|
GGUF |
i1-Q3_K_M |
3.7 |
IQ3_S可能更好 |
GGUF |
i1-Q3_K_L |
4.0 |
IQ3_M可能更好 |
GGUF |
i1-IQ4_XS |
4.0 |
|
GGUF |
i1-IQ4_NL |
4.2 |
首选IQ4_XS |
GGUF |
i1-Q4_0 |
4.2 |
速度快,质量低 |
GGUF |
i1-Q4_K_S |
4.3 |
大小/速度/质量最优 |
GGUF |
i1-Q4_K_M |
4.5 |
速度快,推荐使用 |
GGUF |
i1-Q4_1 |
4.6 |
|
GGUF |
i1-Q5_K_S |
5.0 |
|
GGUF |
i1-Q5_K_M |
5.2 |
|
GGUF |
i1-Q6_K |
5.9 |
实际上类似于静态Q6_K |
以下是ikawrakow提供的一个比较一些低质量量化类型的便捷图表(数值越低越好):

此外,你可以查看Artefact2对此事的看法:https://gist.github.com/Artefact2/b5f810600771265fc1e39442288e8ec9
常见问题解答/模型请求
你可以访问https://huggingface.co/mradermacher/model_requests获取一些常见问题的答案,或者如果你需要对其他模型进行量化。
📄 许可证
本项目采用apache-2.0
许可证。
🙏 致谢
感谢我的公司nethype GmbH允许我使用其服务器,并对我的工作站进行升级,使我能够在业余时间完成这项工作。此外,感谢@nicoboss让我使用他的私人超级计算机,使我能够提供更多、质量更高的矩阵量化版本。