T

T5 V1.1 Base Dutch Cnn Test

由 yhavinga 开发
基于T5架构的荷兰语新闻摘要模型,针对CNN每日邮报荷兰语版微调
下载量 176
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是在荷兰语T5基础模型上微调的序列到序列模型,专门用于生成荷兰语新闻文章的摘要。

模型特点

荷兰语专用
基于荷兰语mC4清洗版数据集训练,专门处理荷兰语文本
高质量摘要
在荷兰语CNN每日邮报数据集上微调,生成ROUGE-L 25.9的摘要质量
优化分词器
使用专门针对荷兰语训练的SentencePiece分词器,处理效果更佳
数据清洗
训练数据经过严格过滤,移除低质量内容和异常文本

模型能力

荷兰语文本理解
新闻摘要生成
长文本压缩

使用案例

新闻媒体
新闻自动摘要
为荷兰语新闻文章自动生成简明摘要
平均生成91词左右的摘要,ROUGE-L得分25.9
内容分析
关键信息提取
从长篇荷兰语文档中提取核心信息