T

T5 Small Lm Adapt

由 google 开发
T5 1.1语言模型适配版是基于原始T5模型的改进版本,针对语言建模任务进行了优化,提升了在提示调优中的应用能力。
下载量 769
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是T5 1.1的小规模版本,通过语言建模目标额外训练了10万步,显著提升了在提示调优中的表现。

模型特点

GEGLU激活函数
在前馈隐藏层使用GEGLU激活函数替代ReLU,提升模型性能。
预训练优化
预训练阶段关闭Dropout以提高质量,微调阶段重新启用Dropout。
参数调整
嵌入层与分类器层取消参数共享,调整模型结构参数。
双重预训练目标
同时针对去噪和语言建模目标进行预训练。

模型能力

文本生成
文本分类
问答系统
摘要生成

使用案例

自然语言处理
提示调优
通过提示调优(prompt tuning)快速适应下游任务。
显著提升在提示调优中的应用能力。
文本生成
生成连贯、上下文相关的文本。