B

Babyberta 3

由 phueb 开发
BabyBERTa 是基于 RoBERTa 的轻量级版本,专为语言习得研究设计,训练数据为 500 万单词的美国英语儿童导向输入语料。
下载量 22
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

BabyBERTa 是一个轻量级的语言模型,基于 RoBERTa 架构,专为研究儿童语言习得而开发。它能够在单台配备单个 GPU 的桌面电脑上运行,无需高性能计算基础设施。

模型特点

轻量级设计
模型专为在单台配备单个 GPU 的桌面电脑上运行而设计,无需高性能计算基础设施。
儿童导向输入
训练数据为 500 万单词的美国英语儿童导向输入语料,适合语言习得研究。
语法知识学习
模型专为从儿童导向输入中学习语法知识而开发,通过 Zorro 测试套件进行评估。
训练优化
在训练过程中从不预测未掩码标记(unmask_prob 参数设置为零)。

模型能力

语言建模
语法知识学习
儿童语言习得研究

使用案例

语言习得研究
儿童语言发展研究
使用 BabyBERTa 分析儿童导向输入中的语法知识学习过程。
在 Zorro 测试套件上达到 80.3 的整体准确率。