P

Pythia 410m

由 EleutherAI 开发
Pythia是EleutherAI开发的一系列因果语言模型,专为可解释性研究设计,包含从7000万到120亿参数的8种规模,提供154个训练检查点
下载量 83.28k
发布时间 : 2/13/2023
模型介绍
内容详情
替代品

模型简介

基于Transformer的英语语言模型,采用GPT-NeoX架构,训练于Pile数据集,主要用于研究大语言模型的行为和功能

模型特点

完整训练检查点
提供154个训练中间检查点,便于研究模型演化过程
科学实验设计
所有规模模型使用相同训练数据和顺序,确保实验可比性
性能对标
达到或超越同类规模模型(如OPT、GPT-Neo)的性能
去重对比
每个规模提供原始数据和全局去重数据训练的两种版本

模型能力

英语文本生成
语言模型行为研究
模型可解释性分析

使用案例

学术研究
语言模型行为分析
研究模型在不同训练阶段的参数变化规律
可通过154个检查点追踪模型能力发展
去重数据影响研究
比较原始数据与去重数据训练模型的性能差异
技术验证
中等规模模型基准测试
作为4亿参数级别的参考模型进行技术对比
性能优于同类OPT-350M模型