R

RWKV7 Goose Pile 168M HF

由 RWKV 开发
采用闪存线性注意力格式的RWKV-7模型,基于Pile数据集训练,支持英语文本生成任务。
下载量 57
发布时间 : 3/17/2025
模型介绍
内容详情
替代品

模型简介

这是一个1.68亿参数的RWKV-7模型,采用闪存线性注意力格式,主要用于英语文本生成任务。

模型特点

闪存线性注意力格式
采用闪存线性注意力格式,提高模型效率。
动态状态演化
支持表达性动态状态演化,增强模型表现力。
高效训练
使用bfloat16格式和余弦衰减学习率进行高效训练。

模型能力

文本生成
语言建模

使用案例

文本生成
开放域文本生成
生成连贯、有意义的英语文本。
语言理解
语言模型评估
在LAMBADA和PIQA等基准测试中评估语言理解能力。
LAMBADA准确率45.6%,PIQA准确率65.5%