英语文本理解
IF I L V1.0
DeepFloyd-IF是基于像素的三级级联扩散模型,能以全新水准实现照片级真实感和语言理解。
文本生成图像
I
DeepFloyd
4,299
20
IF II L V1.0
DeepFloyd-IF是基于像素的三级级联扩散模型,能以卓越的写实性和语言理解生成图像,零样本FID-30K得分达6.66。
文本生成图像
I
DeepFloyd
33.76k
53
Roberta Base 100M 3
在1M至1B词元规模数据集上预训练的RoBERTa变体,包含BASE和MED-SMALL两种规格,适用于资源有限场景下的自然语言处理任务
大型语言模型
R
nyu-mll
18
0
Albert Xlarge V2
Apache-2.0
ALBERT XLarge v2是基于Transformer架构的英语预训练模型,采用参数共享机制减少内存占用,通过掩码语言建模和句子顺序预测目标训练。
大型语言模型
Transformers
英语
A
albert
2,195
11
Albert Base V1
Apache-2.0
ALBERT是基于Transformer架构的轻量级预训练语言模型,通过自监督学习在英语文本上训练,具有参数共享特性以减少内存占用。
大型语言模型
Transformers
英语
A
albert
18.34k
11
Roberta Base
MIT
基于Transformer架构的英语预训练模型,通过掩码语言建模目标在海量文本上训练,支持文本特征提取和下游任务微调
大型语言模型
英语
R
FacebookAI
9.3M
488
Albert Large V2
Apache-2.0
ALBERT Large v2是基于英语语料、采用掩码语言建模(MLM)目标预训练的Transformer模型,具有参数共享的特点。
大型语言模型
Transformers
英语
A
albert
6,841
19
Albert Large V1
Apache-2.0
ALBERT是基于英语语料预训练的轻量级BERT变体,通过参数共享减少内存占用,支持掩码语言建模和句子顺序预测任务。
大型语言模型
Transformers
英语
A
albert
979
3
Distilroberta Base
Apache-2.0
DistilRoBERTa是RoBERTa-base模型的蒸馏版本,参数更少但速度更快,适用于英语文本处理任务。
大型语言模型
英语
D
distilbert
1.2M
153
Albert Xxlarge V2
Apache-2.0
ALBERT XXLarge v2是基于掩码语言建模目标预训练的大型语言模型,采用参数共享的Transformer架构,具有12层重复结构和2.23亿参数。
大型语言模型
英语
A
albert
19.79k
20
Albert Xxlarge V1
Apache-2.0
ALBERT XXLarge v1是基于英语语料、采用掩码语言建模(MLM)目标预训练的Transformer模型,具有参数共享特性。
大型语言模型
Transformers
英语
A
albert
930
5
Albert Xlarge V1
Apache-2.0
ALBERT XLarge v1是基于英语语料预训练的大型语言模型,采用参数共享的轻量化Transformer架构,专注于掩码语言建模和句子顺序预测任务。
大型语言模型
Transformers
英语
A
albert
516
4
Roberta Large
MIT
基于掩码语言建模目标预训练的大型英语语言模型,采用改进的BERT训练方法
大型语言模型
英语
R
FacebookAI
19.4M
212