M

Modernbert Embed Base Legal Matryoshka 2

由 manishh16 开发
基于ModernBERT架构优化的法律领域嵌入模型,支持多维度特征提取和句子相似度计算
下载量 14
发布时间 : 3/28/2025
模型介绍
内容详情
替代品

模型简介

该模型是基于ModernBERT架构优化的法律文本嵌入模型,专门用于处理法律文档的句子相似度计算和特征提取任务。采用MatryoshkaLoss训练方法,支持不同维度的嵌入表示。

模型特点

多维度嵌入支持
支持768/512/256/128/64等多种嵌入维度,可根据应用场景灵活选择
法律领域优化
专门针对法律文本进行优化,能更好理解法律术语和文档结构
Matryoshka训练方法
采用MatryoshkaLoss训练策略,使模型在不同维度都能保持良好性能
高效检索能力
在信息检索任务中表现出色,特别是在法律文档检索场景

模型能力

法律文本特征提取
句子相似度计算
信息检索
多维度嵌入表示

使用案例

法律文档处理
法律案例检索
根据查询语句检索相关法律案例
在768维设置下达到0.59的准确率@1
合同条款匹配
匹配合同中的相似条款
在512维设置下达到0.69的准确率@5
法律研究辅助
判例法分析
分析判例法中的相似判决
在256维设置下达到0.72的召回率@10