R

Retnet Mini Shakespeare

由 jploski 开发
一个基于保留网络(RetNet)架构训练的微型语言模型,使用tinyshakespeare数据集训练,用于展示保留网络的训练和循环推理过程。
下载量 59
发布时间 : 8/5/2023
模型介绍
内容详情
替代品

模型简介

该模型是一个演示性质的微型语言模型,主要用于展示保留网络(RetNet)架构的训练和O(1)复杂度循环推理能力。

模型特点

保留网络架构
采用RetNet架构,结合了训练并行性和高效O(1)推理的优势
轻量级实现
通过调整配置参数成为非常小的模型,适合演示和实验
循环推理能力
展示保留网络的循环推理过程,具有O(1)复杂度

模型能力

字符级文本生成
莎士比亚风格文本模仿

使用案例

教育与演示
保留网络架构演示
用于展示保留网络的训练和推理过程
微型语言模型实验
适合进行小规模语言模型实验和研究