M

Modernce Base Sts

由 dleemiller 开发
ModernBERT交叉编码器是一个高性能的语义相似度模型,专为评估文本相似度设计,支持长上下文处理。
下载量 351
发布时间 : 1/13/2025
模型介绍
内容详情
替代品

模型简介

该模型基于ModernBERT-base架构,通过交叉编码器方式比较两段文本的语义相似度,输出0-1的相似度分数。适用于评估大语言模型输出、文本匹配等场景。

模型特点

高性能
在STS-Benchmark测试集上达到皮尔逊系数0.9162和斯皮尔曼系数0.9122。
高效架构
基于ModernBERT-base设计(1.49亿参数),推理速度更快。
扩展的上下文长度
支持处理长达8192个标记的序列,非常适合评估LLM输出。
多样化训练
在dleemiller/wiki-sim上预训练,并在sentence-transformers/stsb上微调。

模型能力

语义相似度计算
文本对比较
长文本处理

使用案例

文本评估
大语言模型输出评估
评估大语言模型生成的文本与参考文本的语义相似度。
提供0-1的相似度分数,帮助量化模型输出质量。
文本匹配
比较两段文本的语义相似度,用于问答系统、信息检索等场景。
高准确度的相似度评分,提升匹配效果。