P

Pythia 160m

由 EleutherAI 开发
Pythia-160M是EleutherAI开发的可解释性研究专用语言模型,属于Pythia套件中的160M参数规模版本,基于Transformer架构,训练于Pile数据集。
下载量 163.75k
发布时间 : 2/8/2023
模型介绍
内容详情
替代品

模型简介

Pythia-160M是专为大型语言模型可解释性研究设计的因果语言模型,提供154个训练检查点便于分析模型演变过程。

模型特点

可解释性研究支持
提供154个训练检查点(包括初始和中间状态),支持模型行为演变分析
严格训练控制
所有Pythia模型在完全相同的数据顺序下训练,确保实验可比性
性能优化
使用Flash Attention技术提升训练效率

模型能力

英语文本生成
语言模型行为分析
文本续写

使用案例

学术研究
语言模型可解释性研究
利用多检查点特性分析模型学习过程中的行为变化
可追踪特定能力或偏见的形成过程
模型缩放规律研究
通过对比Pythia套件不同规模模型探究参数量的影响