X

Xtremedistil L6 H384 Uncased Finetuned Wikitext103

由 saghar 开发
该模型是基于微软Xtremedistil模型的轻量级蒸馏版本,在wikitext数据集上进行了微调,适用于文本生成任务。
下载量 18
发布时间 : 3/19/2022
模型介绍
内容详情
替代品

模型简介

这是一个经过微调的轻量级语言模型,基于微软的Xtremedistil架构,专门针对wikitext数据进行了优化,可用于文本生成和相关自然语言处理任务。

模型特点

轻量级架构
采用6层384维隐藏层的精简架构,相比完整模型更高效
wikitext优化
专门针对wikitext数据进行了微调,适合处理维基百科风格的文本
高效训练
使用Adam优化器和线性学习率调度器,在3个epoch内完成微调

模型能力

文本生成
语言模型微调

使用案例

文本生成
维基百科风格文本生成
生成类似维基百科条目的结构化文本
在wikitext验证集上达到6.5526的损失值
教育研究
语言模型研究
作为轻量级语言模型的研究基准