标签:
- 句子转换器
- 句子相似度
- 损失函数:在线对比损失
基础模型: 阿里巴巴NLP/gte-modernbert-base
管道标签: 句子相似度
库名称: sentence-transformers
评估指标:
- 余弦准确率
- 余弦精确率
- 余弦召回率
- 余弦F1值
- 余弦平均精度
模型索引:
- 名称: 基于阿里巴巴NLP/gte-modernbert-base的SentenceTransformer
结果:
- 任务:
类型: 我的二分类任务
名称: 我的二分类
数据集:
名称: Quora
类型: 未知
指标:
- 类型: 余弦准确率
值: 0.90
名称: 余弦准确率
- 类型: 余弦F1值
值: 0.87
名称: 余弦F1值
- 类型: 余弦精确率
值: 0.84
名称: 余弦精确率
- 类型: 余弦召回率
值: 0.90
名称: 余弦召回率
- 类型: 余弦平均精度
值: 0.92
名称: 余弦平均精度
基于阿里巴巴NLP/gte-modernbert-base的Redis语义缓存嵌入模型
这是一个基于阿里巴巴NLP/gte-modernbert-base微调的sentence-transformers模型,训练数据来自Quora数据集。该模型将句子和段落映射到768维稠密向量空间,可用于语义文本相似度计算,以实现语义缓存功能。
模型详情
模型描述
模型来源
完整模型架构
SentenceTransformer(
(0): Transformer({'max_seq_length': 8192, 'do_lower_case': False}) with Transformer model: ModernBertModel
(1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': True, 'pooling_mode_mean_tokens': False, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
)
使用方式
首先安装Sentence Transformers库:
pip install -U sentence-transformers
然后可以加载此模型并运行推理。
from sentence_transformers import SentenceTransformer
model = SentenceTransformer("redis/langcache-embed-v1")
sentences = [
'印度卢比在500和1000面额纸币禁令后价值会上涨吗?',
'禁止500和1000卢比纸币对印度经济会有什么影响?',
"Danish Sait的恶作剧电话是假的吗?",
]
embeddings = model.encode(sentences)
print(embeddings.shape)
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
二分类评估
指标 |
值 |
余弦准确率 |
0.90 |
余弦F1值 |
0.87 |
余弦精确率 |
0.84 |
余弦召回率 |
0.90 |
余弦平均精度 |
0.92 |
训练数据集
Quora
- 数据集: Quora
- 样本量: 323491个训练样本
- 列:
question_1
, question_2
, 和 label
评估数据集
Quora
- 数据集: Quora
- 样本量: 53486个评估样本
- 列:
question_1
, question_2
, 和 label
引用
BibTeX
Redis Langcache-embed 模型
@inproceedings{langcache-embed-v1,
title = "利用领域特定嵌入和合成数据推进LLM的语义缓存",
author = "Gill, Cechmanek, Hutcherson, Rajamohan, Agarwal, Gulzar, Singh, Dion",
month = "04",
year = "2025",
url = "https://arxiv.org/abs/2504.02268",
}
Sentence Transformers
@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: 使用孪生BERT网络的句子嵌入",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "2019年自然语言处理实证方法会议论文集",
month = "11",
year = "2019",
publisher = "计算语言学协会",
url = "https://arxiv.org/abs/1908.10084",
}