pegasus-billsum开源账单摘要生成模型 - 免费部署，在billsum数据集表现佳

首页

Pegasus Billsum

由 vuiseng9 开发

基于PEGASUS-large微调的账单摘要生成模型，在billsum数据集上表现优异

文本生成

Transformers

#法律文本摘要 #高精度Rouge #长文本处理

下载量 42

发布时间 : 3/2/2022

模型简介

该模型是基于PEGASUS架构的文本摘要模型，专门针对法律账单文本的摘要生成任务进行了优化

模型特点

高效摘要生成

针对法律账单文本优化的摘要生成能力

基于PEGASUS架构

采用Google提出的预训练摘要生成架构

高性能ROUGE指标

在billsum测试集上达到rougeL 44.8的高分

模型能力

法律文本摘要生成

长文本压缩

关键信息提取

使用案例

法律文档处理

账单摘要生成

自动生成法律账单的简洁摘要

ROUGE-L 44.8的摘要质量

文档自动化

长文档关键信息提取

从冗长法律文档中提取核心内容

🚀 Pegasus模型训练与评估项目

本项目基于transformers v4.13开发了一个模型，在这个分支中有一些小的补丁。

🚀 快速开始

环境准备

本项目需要克隆特定的仓库并切换到指定的分支，以下是具体的操作步骤：

git clone https://github.com/vuiseng9/transformers
cd transformers
git checkout pegasus-v4p13 && git reset --hard 41eeb07
# 安装依赖，设置摘要生成相关依赖
# . . .

模型训练

以下是训练模型的脚本，你可以根据需求调整参数：

#!/usr/bin/env bash

export CUDA_VISIBLE_DEVICES=0,1,2,3

NEPOCH=10
RUNID=pegasus-billsum-${NEPOCH}eph-run1
OUTDIR=/data1/vchua/pegasus-hf4p13/pegasus/${RUNID}
mkdir -p $OUTDIR

nohup python run_summarization.py \
    --model_name_or_path google/pegasus-large \
    --dataset_name billsum \
    --do_train \
    --adafactor \
    --learning_rate 2e-4 \
    --label_smoothing_factor 0.1 \
    --num_train_epochs $NEPOCH \
    --per_device_train_batch_size 2 \
    --do_eval \
    --per_device_eval_batch_size 2 \
    --num_beams 8 \
    --max_source_length 1024 \
    --max_target_length 256 \
    --evaluation_strategy steps \
    --eval_steps 1000 \
    --save_strategy steps \
    --save_steps 2000 \
    --logging_steps 1 \
    --overwrite_output_dir \
    --run_name $RUNID \
    --output_dir $OUTDIR > $OUTDIR/run.log 2>&1 &

模型评估

以下是评估模型的脚本，同样可以根据需要调整参数：

#!/usr/bin/env bash

export CUDA_VISIBLE_DEVICES=3

DT=$(date +%F_%H-%M)
RUNID=pegasus-billsum-${DT}
OUTDIR=/data1/vchua/pegasus-hf4p13/pegasus-test/${RUNID}
mkdir -p $OUTDIR

nohup python run_summarization.py \
    --model_name_or_path vuiseng9/pegasus-billsum \
    --dataset_name billsum \
    --max_source_length 1024 \
    --max_target_length 256 \
    --do_predict \
    --per_device_eval_batch_size 8 \
    --predict_with_generate \
    --num_beams 8 \
    --overwrite_output_dir \
    --run_name $RUNID \
    --output_dir $OUTDIR > $OUTDIR/run.log 2>&1 &

评估结果

尽管模型进行了10个epoch的微调，但本模型采用的是训练过程中评估损失最低的检查点（@12000步，6.6个epoch，210分钟）。使用此检查点进行测试/预测，结果如下：

***** predict metrics *****
  predict_gen_len            =   179.7363
  predict_loss               =     1.2452
  predict_rouge1             =    56.8657
  predict_rouge2             =    38.6531
  predict_rougeL             =    44.8399
  predict_rougeLsum          =    51.6266
  predict_runtime            = 1:19:28.20
  predict_samples            =       3269
  predict_samples_per_second =      0.686
  predict_steps_per_second   =      0.086