两阶段训练
Rope Vit Reg4 B14 Capi Imagenet21k
Apache-2.0
采用RoPE的ViT图像分类模型,经过CAPI预训练和ImageNet-21K微调,适用于图像分类和检测任务。
图像分类
R
birder-project
40
0
Lamate
MIT
LaMaTE是基于Llama-3-8B开发的高性能高效翻译模型,利用大语言模型作为机器翻译编码器,搭配轻量级解码器。
机器翻译
支持多种语言
L
NiuTrans
20
2
Kb Whisper Small
Apache-2.0
瑞典国家图书馆发布的Whisper模型,专为瑞典语优化,在50,000+小时瑞典语音数据上训练,性能超越OpenAI原版
语音识别
Transformers
其他
K
KBLab
28.61k
3
Bamba 9B V1
Apache-2.0
Bamba-9B 是基于 Mamba-2 架构的解码器专用语言模型,经过两阶段训练,擅长处理广泛的文本生成任务。
大型语言模型
B
ibm-ai-platform
16.19k
35
K2
Apache-2.0
K2是一个650亿参数规模的大语言模型,通过完全透明化的训练方案,以35%计算量优势超越Llama 2 70B。
大型语言模型
Transformers
英语
K
LLM360
109
89
Dragoman
Apache-2.0
Dragoman 是一个句子级别的英乌翻译模型,采用两阶段训练流程,在FLORES-101英乌开发测试子集上取得了BLEU值为32.34的最优性能。
机器翻译
支持多种语言
D
lang-uk
407
12
Ahma 7B
Apache-2.0
Ahma-7B是基于Meta Llama(v1)架构的70亿参数仅解码器Transformer模型,完全使用芬兰语从头预训练。
大型语言模型
Transformers
其他
A
Finnish-NLP
201
8
Animagine Xl 3.0 Base
其他
Animagine XL 3.0 基础版是先进动漫文本生成图像模型的基础版本,专注于建立核心功能并完善关键方面。
图像生成
英语
A
cagliostrolab
810
45