R

Randeng MegatronT5 770M

由 IDEA-CCNL 开发
擅长处理自然语言转换任务的中文版T5-large模型
下载量 16
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个基于T5架构的大规模中文自然语言处理模型,专注于自然语言转换任务。

模型特点

中文优化
专门针对中文自然语言处理任务进行优化
大规模预训练
基于180GB悟道语料库进行预训练
高效训练
使用Megatron-LM框架,16张A100显卡14天完成训练

模型能力

文本转换
自然语言理解
自然语言生成

使用案例

文本处理
文本摘要
将长文本转换为简洁摘要
文本改写
保持语义不变的情况下改写文本