标签:
- 句子转换器
- 句子相似度
- 特征提取
- 训练生成
- 数据集大小:10000
- 损失函数:余弦相似度损失
基础模型: Alibaba-NLP/gte-multilingual-base
小部件:
- 源句: 家庭结构如何影响社会发展?
句子:
- 生活方式选择如吸烟、不良饮食和缺乏运动可能导致各种心脏疾病。
- 家庭结构能显著影响儿童的社会发展,通过提供不同层次的情感支持、社交机会和行为榜样。
- 电影行业因缺乏多样性和代表性而受到批评。
- 源句: 影响通货膨胀的主要因素有哪些?
句子:
- 通货膨胀对政策制定者来说可能是个挑战性议题。
- 沙漠生态系统以降雨稀少和高温为特征,为动植物创造了极具挑战性的生存条件。
- Z分数用于标准正态分布,而t分数则在样本量小且总体标准差未知时使用。
- 源句: 抗生素如何在细胞层面发挥作用?
句子:
- 某些食肉植物,如捕蝇草,拥有快速动作机制来捕捉猎物。
- 抗生素是一类药物,可由医生开具用于治疗感染。
- 通货膨胀率可通过多种指标衡量,如消费者价格指数(CPI)和生产者价格指数(PPI)。
- 源句: J.K.罗琳的《哈利·波特》系列如何影响现代文学?
句子:
- J.K.罗琳以笔名罗伯特·加尔布雷思创作了其他犯罪小说。
- 丙烯颜料常用于现代艺术,而油画颜料几个世纪以来一直用于古典艺术。
- 深海鱼类具备生物发光、耐压身体结构和特殊摄食机制等适应性特征,以在极端环境中生存。
- 源句: 有机农业与传统农业的区别是什么?
句子:
- 虽然置信区间很有用,但如果未满足基本假设,可能会被错误解读。
- 水资源保护的历史可追溯至发展灌溉系统的古代文明。
- 农贸市场是从当地农民直接购买有机产品的热门场所。
数据集:
- xmanii/maux-gte-10k-public
管道标签: 句子相似度
库名称: sentence-transformers
指标:
- 皮尔逊余弦
- 斯皮尔曼余弦
模型索引:
- 名称: 基于Alibaba-NLP/gte-multilingual-base的SentenceTransformer
结果:
- 任务:
类型: 语义相似度
名称: 语义相似度
数据集:
名称: 未知
类型: 未知
指标:
- 类型: 皮尔逊余弦
值: 0.9487949766869277
名称: 皮尔逊余弦
- 类型: 斯皮尔曼余弦
值: 0.947885967258665
名称: 斯皮尔曼余弦
基于Alibaba-NLP/gte-multilingual-base的SentenceTransformer
这是一个基于Alibaba-NLP/gte-multilingual-base模型,在maux-gte-10k-public数据集上微调的sentence-transformers模型。它将句子和段落映射到768维密集向量空间,可用于语义文本相似度、语义搜索、复述挖掘、文本分类、聚类等任务。
模型详情
模型描述
模型来源
完整模型架构
SentenceTransformer(
(0): Transformer({'max_seq_length': 8192, 'do_lower_case': False}) with Transformer model: NewModel
(1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': True, 'pooling_mode_mean_tokens': False, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
(2): Normalize()
)
使用方式
直接使用(Sentence Transformers)
首先安装Sentence Transformers库:
pip install -U sentence-transformers
然后可以加载此模型并运行推理。
from sentence_transformers import SentenceTransformer
model = SentenceTransformer("xmanii/maux-gte-persian-v2")
sentences = [
'有机农业与传统农业的区别是什么?',
'农贸市场是从当地农民直接购买有机产品的热门场所。',
'水资源保护的历史可追溯至发展灌溉系统的古代文明。',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
评估
指标
语义相似度
指标 |
值 |
皮尔逊余弦 |
0.9488 |
斯皮尔曼余弦 |
0.9479 |
训练详情
训练数据集
maux-gte-10k-public
训练超参数
非默认超参数
eval_strategy
: 步数
per_device_train_batch_size
: 32
per_device_eval_batch_size
: 32
learning_rate
: 2e-05
num_train_epochs
: 5
warmup_ratio
: 0.1
fp16
: 是
load_best_model_at_end
: 是
训练日志
周期 |
步数 |
训练损失 |
验证损失 |
斯皮尔曼余弦 |
0.1597 |
50 |
0.0663 |
- |
- |
0.3195 |
100 |
0.0409 |
0.0298 |
0.7983 |
0.4792 |
150 |
0.0342 |
- |
- |
0.6390 |
200 |
0.0294 |
0.0230 |
0.8464 |
0.7987 |
250 |
0.0296 |
- |
- |
0.9585 |
300 |
0.0298 |
0.0220 |
0.8610 |
1.1182 |
350 |
0.0249 |
- |
- |
1.2780 |
400 |
0.0237 |
0.0230 |
0.8745 |
1.4377 |
450 |
0.0241 |
- |
- |
1.5974 |
500 |
0.0218 |
0.0166 |
0.8900 |
1.7572 |
550 |
0.0227 |
- |
- |
1.9169 |
600 |
0.0231 |
0.0148 |
0.9045 |
2.0767 |
650 |
0.0196 |
- |
- |
2.2364 |
700 |
0.0173 |
0.0131 |
0.9179 |
2.3962 |
750 |
0.0172 |
- |
- |
2.5559 |
800 |
0.0172 |
0.0119 |
0.9231 |
2.7157 |
850 |
0.0167 |
- |
- |
2.8754 |
900 |
0.0172 |
0.0120 |
0.9291 |
3.0351 |
950 |
0.0175 |
- |
- |
3.1949 |
1000 |
0.013 |
0.0100 |
0.9362 |
3.3546 |
1050 |
0.0128 |
- |
- |
3.5144 |
1100 |
0.0129 |
0.0101 |
0.9390 |
3.6741 |
1150 |
0.0134 |
- |
- |
3.8339 |
1200 |
0.0137 |
0.0095 |
0.9430 |
3.9936 |
1250 |
0.0133 |
- |
- |
4.1534 |
1300 |
0.0109 |
0.0096 |
0.9449 |
4.3131 |
1350 |
0.0114 |
- |
- |
4.4728 |
1400 |
0.0111 |
0.0083 |
0.9479 |