M
Modernbert Embed Base Legal Matryoshka 2
由 manishh16 开发
基于ModernBERT架构优化的法律领域嵌入模型,支持多维度特征提取和句子相似度计算
下载量 14
发布时间 : 3/28/2025
模型简介
该模型是基于ModernBERT架构优化的法律文本嵌入模型,专门用于处理法律文档的句子相似度计算和特征提取任务。采用MatryoshkaLoss训练方法,支持不同维度的嵌入表示。
模型特点
多维度嵌入支持
支持768/512/256/128/64等多种嵌入维度,可根据应用场景灵活选择
法律领域优化
专门针对法律文本进行优化,能更好理解法律术语和文档结构
Matryoshka训练方法
采用MatryoshkaLoss训练策略,使模型在不同维度都能保持良好性能
高效检索能力
在信息检索任务中表现出色,特别是在法律文档检索场景
模型能力
法律文本特征提取
句子相似度计算
信息检索
多维度嵌入表示
使用案例
法律文档处理
法律案例检索
根据查询语句检索相关法律案例
在768维设置下达到0.59的准确率@1
合同条款匹配
匹配合同中的相似条款
在512维设置下达到0.69的准确率@5
法律研究辅助
判例法分析
分析判例法中的相似判决
在256维设置下达到0.72的召回率@10
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文