语言:
- 英语
许可证: Apache-2.0
数据集:
- theatticusproject/cuad
评估指标:
- 准确率
任务标签: 文本分类
示例:
- 文本: "本协议应受加利福尼亚州法律和香港法律的管辖、解释与执行"
示例标题: "管辖法律"
- 文本: "阿拉莫戈多金融公司 AF共同控股公司 MHC 阿拉莫戈多联邦储蓄贷款协会银行 储蓄协会保险基金 SAIF 联邦存款保险公司 FDIC 查尔斯·韦伯公司 Bruyette & Woods公司代理"
示例标题: "缔约方"
- 文本: "本协议自生效日起开始,除非根据本协议提前终止或经双方协商一致延长,否则将持续三十六(36)个月(即协议期限)。本协议将在Imprimis和Surgical双方签署的较晚日期(生效日)生效,并依据工作说明书的条款终止(协议期限)"
示例标题: "到期日"
释放深度学习在条款分类中的力量:革新商业应用
在瞬息万变的商业运营环境中,文档处理的效率与准确性至关重要。传统法律条款与合同分析方法往往耗时且易出错。然而,随着深度学习技术的兴起,尤其是在条款分类领域,自动化与精准化的新时代已然来临。
这是基于"google-bert/bert-base-cased"的微调版本,专为分类任务优化,使用了超过3200条从Atticus Project标注的合同中提取的条款示例[https://www.atticusprojectai.org/]。
通过ATTICUS项目等倡议及人工智能的持续进步,商业文档分析的未来充满希望——在这个未来中,深度学习将从推动全球经济的海量文本信息中释放效率、洞察力与价值,扮演关键角色。
实际应用
实践中,深度学习在条款分类中的整合已跨越多个行业:
-
法律服务:律师事务所和法律部门利用深度学习简化合同审查流程,高效提取关键信息。
-
金融与保险:深度学习模型协助分析复杂金融协议,识别涉及风险因素、责任与合规性的条款。
-
医疗与制药:高度监管行业中的公司运用深度学习分析患者合同、供应商协议及监管文件。
测试准确率: 88%
标签说明:
"0": "禁止转让条款",
"1": "审计权条款",
"2": "责任上限条款",
"3": "不起诉承诺条款",
"4": "生效日期条款",
"5": "到期日条款",
"6": "管辖法律条款",
"7": "保险条款",
"8": "许可授予条款",
"9": "不可转让许可条款",
"10": "终止/续约通知期条款",
"11": "缔约方条款",
"12": "终止后服务条款",
"13": "续约期限条款",
"14": "收入/利润分成条款",
"15": "无限责任条款",
"16": "质保期限条款"
使用指南
加载模型前请先安装transformers库
pip install transformers
from transformers import pipeline
classifier = pipeline("text-classification", model="mauro/bert-base-uncased-finetuned-clause-type")
管道是使用模型最简便的方式。
示例条款:
clause = """ 前述许可仅可由母公司集团转让或分许可给被允许方,且受限于本文限制条件,随母公司业务出售或转让而转移。若母公司签订协议转让其根据第3.1条获得的许可授权(涉及母公司业务出售或转让时),则SpinCo及其集团成员应作为该转让协议的第三方受益人,以强制执行许可违约行为。3. 若SpinCo签订协议转让其根据第3.2条获得的许可授权(涉及SpinCo业务出售或转让时),则母公司及其集团成员应作为该转让协议的第三方受益人,以强制执行许可违约行为。该协议应禁止被允许方(或在母公司业务转让情况下的受让方)对许可SpinCo知识产权进行超出母公司许可范围的分许可/转让或使用。该协议应禁止该方对转让知识产权进行超出SpinCo许可范围的进一步转让或使用"""
分类结果将返回:
[{'label': '不可转让许可条款', 'score': 0.989809513092041}]
可视化分析
需安装Matplotlib和Pandas库。
pip install matplotlib pandas
# 获取所有概率预测
preds = classifier(clause, return_all_scores=True)
# 创建结果数据框
df = pd.DataFrame([[x['label'], x['score']] for x in preds[0]], columns=['标签', '置信度'])
# 绘制概率分布图
plt.bar(df['标签'], df['置信度'])
plt.xlabel('条款类型')
plt.ylabel('置信度')
plt.title('各类条款概率分布')
plt.xticks(rotation=90)
plt.show()
您将获得所有分类的概率分布图:

许可证: Apache-2.0