旋转位置嵌入
Modernbert Base Squad2 V0.2
Apache-2.0
基于ModernBERT-base-nli微调的问答模型,支持长上下文处理
问答系统
Transformers
M
Praise2112
42
2
Modernbert Base Ita
Apache-2.0
ModernBERT 是一种现代化的双向仅编码器 Transformer 模型(BERT 风格),在 2 万亿英语和代码数据上进行了预训练,原生上下文长度高达 8,192 个标记。
大型语言模型
Transformers
支持多种语言
M
DeepMount00
81
10
E5rope Base
MIT
E5-RoPE-基础版是基于旋转位置嵌入(RoPE)的嵌入模型,旨在支持长上下文检索任务。
文本嵌入
英语
E
dwzhu
129
17
Eva02 Tiny Patch14 224.mim In22k
MIT
EVA02是一个视觉Transformer模型,通过掩码图像建模在ImageNet-22k上预训练,适用于图像分类和特征提取任务。
图像分类
Transformers
E
timm
385
1
Eva02 Small Patch14 224.mim In22k
MIT
EVA02特征/表示模型,通过掩码图像建模在ImageNet-22k上预训练,适用于图像分类和特征提取任务。
图像分类
Transformers
E
timm
705
0
Wav2vec2 Conformer Rope Large 100h Ft
Apache-2.0
基于Librispeech 100小时语音数据微调的Wav2Vec2 Conformer模型,采用旋转位置嵌入技术
语音识别
Transformers
英语
W
facebook
99
0
Wav2vec2 Conformer Rope Large 960h Ft
Apache-2.0
该模型整合了旋转位置嵌入技术,基于16kHz采样的语音音频,在960小时的LibriSpeech数据上进行了预训练和精细调优,适用于英语语音识别任务。
语音识别
Transformers
英语
W
facebook
22.02k
10
Gpt J 6b
Apache-2.0
GPT-J 6B是基于Mesh Transformer JAX框架训练的60亿参数自回归语言模型,采用与GPT-2/3相同的分词器。
大型语言模型
英语
G
EleutherAI
297.31k
1,493