F

Fr Wiki Mlm 42

由 fpadovani 开发
基于未知数据集微调的生成模型,具体训练数据和用途信息缺失
下载量 42
发布时间 : 4/7/2025
模型介绍
内容详情
替代品

模型简介

该模型是基于transformers库训练的生成模型,可能用于文本生成任务。训练过程中使用了线性学习率调度和Adam优化器。

模型特点

线性学习率调度
训练过程中使用了线性学习率调度策略,包含40000步的预热阶段
Adam优化器
采用带betas=(0.9,0.999)和epsilon=1e-08的Adam优化器进行训练
梯度累积
使用梯度累积技术(步数=2)实现更大的有效批大小(32)

模型能力

文本生成

使用案例

文本生成
通用文本生成
可用于生成各类文本内容