句子顺序预测
Multilingual Albert Base Cased 128k
Apache-2.0
基于掩码语言建模(MLM)目标预训练的多语言ALBERT模型,支持60+种语言,具有参数共享的轻量级架构
大型语言模型
Transformers
支持多种语言
M
cservan
277
2
Multilingual Albert Base Cased 64k
Apache-2.0
基于掩码语言建模(MLM)目标预训练的多语言ALBERT模型,支持64k词表大小,区分大小写
大型语言模型
Transformers
支持多种语言
M
cservan
52
1
Albert Base V1
Apache-2.0
ALBERT是基于Transformer架构的轻量级预训练语言模型,通过自监督学习在英语文本上训练,具有参数共享特性以减少内存占用。
大型语言模型
Transformers
英语
A
albert
18.34k
11
Albert Base V2
Apache-2.0
ALBERT是基于Transformer架构的轻量级预训练语言模型,通过参数共享机制减少内存占用,适用于英语文本处理任务。
大型语言模型
英语
A
albert
3.1M
121
Albert Large V2
Apache-2.0
ALBERT Large v2是基于英语语料、采用掩码语言建模(MLM)目标预训练的Transformer模型,具有参数共享的特点。
大型语言模型
Transformers
英语
A
albert
6,841
19
Albert Large V1
Apache-2.0
ALBERT是基于英语语料预训练的轻量级BERT变体,通过参数共享减少内存占用,支持掩码语言建模和句子顺序预测任务。
大型语言模型
Transformers
英语
A
albert
979
3
Albert Xlarge V1
Apache-2.0
ALBERT XLarge v1是基于英语语料预训练的大型语言模型,采用参数共享的轻量化Transformer架构,专注于掩码语言建模和句子顺序预测任务。
大型语言模型
Transformers
英语
A
albert
516
4