LEDBill开源模型 - 免费部署助力法律文本摘要高效生成

首页

Ledbill

由 d0r1h 开发

基于Billsum数据集微调的长文档编码器-解码器(LED)模型，专长于法律文本摘要生成

文本生成

Transformers

其他开源协议:Apache-2.0 #长文档摘要 #法律文本处理 #16K上下文

下载量 22

发布时间 : 5/7/2022

模型简介

该模型是在billsum数据集上对led-base-16384进行微调的版本，擅长处理长文档摘要任务，特别是法律条文类文本。基于Longformer架构，能处理长达16K的文本输入。

模型特点

长文本处理能力

支持处理长达16K token的输入文本，适合法律条文等长文档

专业领域优化

在billsum法律文本数据集上微调，对法律条文摘要具有专业优势

高效注意力机制

采用Longformer的局部+全局注意力模式，平衡计算效率与模型性能

模型能力

法律文本摘要

长文档处理

文本压缩

使用案例

法律领域

法律条文摘要

将复杂的法律条文压缩为简洁摘要

ROUGE-1得分38.65，在法律文本摘要任务中表现优异

法案分析

快速提取法案关键条款和修改内容

模型	rouge1-f	rouge1-p	rouge2-f	rouge2-p	rougeL-f	rougeL-p
LEDBill	34	37	15	16	30	32
led-base	2	15	0	0	2	15

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文

Ledbill

模型简介

模型特点

模型能力

使用案例

🚀 长序列编码器 - 解码器（LED）在Billsum数据集上微调模型

🚀 快速开始

💻 使用示例

基础用法

📚 详细文档

📄 许可证