M

Modernbert Embed Base Legal MRL

由 AdamLucek 开发
基于ModernBERT微调的法律领域句子嵌入模型,支持多层次维度输出,适用于法律文本相似度计算和信息检索任务。
下载量 40
发布时间 : 1/20/2025
模型介绍
内容详情
替代品

模型简介

这是一个针对法律领域优化的句子嵌入模型,能够将文本转换为768维向量,支持多层次维度输出(768/512/256/128/64维),特别适合法律文档的语义相似度计算、信息检索和聚类分析。

模型特点

多层次维度输出
支持768/512/256/128/64维多层次嵌入输出,可根据应用场景灵活选择维度
法律领域优化
使用法律领域合成数据微调,在处理法律文本时表现优异
长文本支持
最大支持8192标记的序列长度,适合处理法律文档等长文本
高效检索能力
在信息检索任务中表现出色,特别是在法律文档检索场景

模型能力

语义文本相似度计算
语义搜索
信息检索
文本聚类
特征提取

使用案例

法律文档处理
法律案例检索
快速检索与查询案例相关的法律文档
在测试集上达到0.63的归一化折损累积增益@10
合同条款匹配
识别合同中的相似条款和关联内容
信息检索系统
法律问答系统
构建基于语义检索的法律问答系统