两阶段训练

# 两阶段训练

Rope Vit Reg4 B14 Capi Imagenet21k

采用RoPE的ViT图像分类模型，经过CAPI预训练和ImageNet-21K微调，适用于图像分类和检测任务。

LaMaTE是基于Llama-3-8B开发的高性能高效翻译模型，利用大语言模型作为机器翻译编码器，搭配轻量级解码器。

机器翻译支持多种语言

Kb Whisper Small

瑞典国家图书馆发布的Whisper模型，专为瑞典语优化，在50,000+小时瑞典语音数据上训练，性能超越OpenAI原版

Transformers 其他

Bamba-9B 是基于 Mamba-2 架构的解码器专用语言模型，经过两阶段训练，擅长处理广泛的文本生成任务。

大型语言模型

ibm-ai-platform

K2是一个650亿参数规模的大语言模型，通过完全透明化的训练方案，以35%计算量优势超越Llama 2 70B。

大型语言模型

Transformers 英语

Dragoman 是一个句子级别的英乌翻译模型，采用两阶段训练流程，在FLORES-101英乌开发测试子集上取得了BLEU值为32.34的最优性能。

机器翻译支持多种语言

Ahma-7B是基于Meta Llama(v1)架构的70亿参数仅解码器Transformer模型，完全使用芬兰语从头预训练。

大型语言模型

Transformers 其他

Animagine Xl 3.0 Base

Animagine XL 3.0 基础版是先进动漫文本生成图像模型的基础版本，专注于建立核心功能并完善关键方面。

图像生成英语

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24