L

Legal Roberta Large

由 lexlms 开发
基于RoBERTa大模型在LeXFiles法律语料库上持续预训练的法律领域语言模型
下载量 367
发布时间 : 11/11/2022
模型介绍
内容详情
替代品

模型简介

LexLM是专门针对法律领域优化的RoBERTa模型系列,通过持续预训练提升法律文本理解能力,支持法律文档分析和处理任务

模型特点

法律领域优化
在多样化LeXFiles法律语料库上持续预训练,专门优化法律文本处理能力
混合大小写支持
与主流大语言模型一致,支持混合大小写文本处理
平衡训练策略
采用指数平滑句子采样器平衡各子语料库的token比例,防止过拟合
高效分词器
训练包含5万BPE的新分词器,复用原始词汇重叠token的嵌入

模型能力

法律文本理解
法律文档分析
法律术语识别
法律文本填充掩码预测

使用案例

法律文档处理
法律协议分析
分析法律协议中的关键条款和术语
法律案件分析
理解法律案件描述中的关键事实和法律问题
法律文本生成
法律文档补全
自动补全法律文档中的缺失内容