T5-SMALL-SUMMARIZATION:面向越南语文本摘要的文本到文本迁移转换器预训练模型
使用示例
import torch
from transformers import T5ForConditionalGeneration, T5Tokenizer
import torch
if torch.cuda.is_available():
device = torch.device("cuda")
print('当前可用GPU数量:%d' % torch.cuda.device_count())
print('将使用GPU设备:', torch.cuda.get_device_name(0))
else:
print('无可用GPU,将使用CPU运行')
device = torch.device("cpu")
model = T5ForConditionalGeneration.from_pretrained("NlpHUST/t5-small-vi-summarization")
tokenizer = T5Tokenizer.from_pretrained("NlpHUST/t5-small-vi-summarization")
model.to(device)
src = "据越南社保局披露,多数企业仍仅按基本工资为员工缴纳社保。\\\\
尽管自2018年1月1日起规定,社保月缴费基数应包含工资及其他补贴款项。\\\\
越南社保局近期发布了社保政策执行情况报告。\\\\
数据显示,拖欠、逃避缴纳社保和失业保险的现象在各省市仍普遍存在。\\\\
截至2020年12月31日统计,社保、医保、失业保险欠费总额超过13.5万亿越南盾,\\\\
占应收账款的3.35%,其中:强制性社保欠费逾8.6万亿盾,\\\\
失业保险欠费3350亿盾。关于社保缴费工资标准,越南社保局报告显示:\\\\
多数企业主要按照最低标准制定工资等级表缴纳社保。\\\\
即采用地区最低工资标准,对经过职业培训的劳动者加算7%,\\\\
对从事繁重、有害、危险或特别繁重有害危险工种的劳动者加算5%或7%。\\\\
对于担任管理职务的劳动者,约80%企业已建立具体职位工资等级表。\\\\
例如生产总监、运营总监、部门主管等职位。其余企业则\\\\
按照专业职务工资表、职务津贴表和责任津贴表为管理人员制定标准。\\\\
越南社保局统计还表明,大多数企业登记缴纳社保时\\\\
仅按基本工资计算,未包含其他补贴款项。尽管2018年1月1日起规定,\\\\
社保月缴费基数应包含工资及其他补贴款项。"
tokenized_text = tokenizer.encode(src, return_tensors="pt").to(device)
model.eval()
summary_ids = model.generate(
tokenized_text,
max_length=256,
num_beams=5,
repetition_penalty=2.5,
length_penalty=1.0,
early_stopping=True
)
output = tokenizer.decode(summary_ids[0], skip_special_tokens=True)
print(output)
输出结果
多数企业主要按照最低标准制定工资等级表缴纳社保。\\
尽管自2018年1月1日起规定,社保月缴费基数应包含工资及其他补贴款项。\\
越南社保局统计表明,多数企业仍仅按基本工资为员工缴纳社保\\
而未包含其他补贴款项。
联系方式
有关本项目的个人沟通事宜,请联系阮文雅(nha282@gmail.com)。