轻量级架构

# 轻量级架构

海豚是一种创新的多模态文档图像解析模型，采用'先分析后解析'的范式处理复杂文档元素。

图像生成文本

Transformers 支持多种语言

Sam2 Hiera Small.fb R896

基于HieraDet图像编码器的SAM2模型，专注于图像特征提取任务。

Linknet Tu Resnet18

Linknet是一个基于PyTorch实现的图像分割模型，适用于语义分割任务。

smp-test-models

Allegro T2V 40x720P

Allegro是一款开源的高质量文本到视频生成模型，能够生成2至6秒、15 FPS的详细视频，支持多种分辨率。

文本生成视频英语

Allegro T2V 40x360P

Allegro是一款开源的文本生成视频模型，支持生成高质量、多样化的动态场景视频。

文本生成视频英语

Hiera Huge 224 Hf

Hiera是一种高效的分层视觉Transformer模型，在图像和视频任务中表现优异且运行速度快

Transformers 英语

Hiera Large 224 Hf

Hiera是一种层次化视觉Transformer模型，兼具快速、强大且简洁的特性，在图像视频任务中超越现有技术且速度更快。

Transformers 英语

Hiera Base Plus 224 Hf

Hiera是一种分层式视觉Transformer模型，兼具快速、强大且简洁的特性，在广泛图像视频任务中超越现有技术水平同时显著提升运行速度。

Transformers 英语

Hiera Base 224 Hf

Hiera是一种层次化视觉Transformer模型，具有快速、强大且简洁的特点，在图像和视频任务中表现优异。

Transformers 英语

Mistral架构的随机初始化模型，适用于端到端测试。

大型语言模型

openaccess-ai-collective

RuLeanALBERT 是一个针对俄语预训练的掩码语言模型，采用了内存高效的架构。

大型语言模型

Transformers 其他

Efficientnet 61 Planet Detection

EfficientNetV2 是一个高效的卷积神经网络架构，特别优化了训练速度和参数效率。61通道版是该架构的一个变体。

LeViT-256是基于Transformer架构的高效视觉模型，专为快速推理设计，在ImageNet-1k数据集上预训练。

ReXNet-1.5x 是一个基于 ImageNette 数据集预训练的轻量级图像分类模型，采用 ReXNet 架构，通过改进残差块中的 Squeeze-Excitation 层来减少通道冗余。

Cspdarknet53 Mish

基于 ImageNette 数据集预训练的 CSP-Darknet-53 Mish 架构图像分类模型

Bert Xsmall Dummy

这是一个小型BERT模型的虚拟示例，用于演示和测试目的

大型语言模型

Roberta Small Bulgarian

这是一个精简版的保加利亚语RoBERTa模型，仅包含6个隐藏层，但保持了相近的性能表现。

大型语言模型其他

Albert Large Arabic

ALBERT大模型的阿拉伯语预训练版本，基于约44亿词的阿拉伯语语料训练

大型语言模型

Transformers 阿拉伯语

Roberta Base 100M 1

基于1B词元规模预训练的RoBERTa基础模型，验证困惑度为3.93，适用于英语文本处理任务。

大型语言模型

ReXNet-1.3x是基于ReXNet架构的图像分类模型，在ImageNette数据集上进行了预训练。该模型通过改进残差块中的Squeeze-Excitation层来减少通道冗余。

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24