轻量级Transformer

# 轻量级Transformer

SAUTE是一种轻量级、具备说话者感知能力的Transformer架构，专为有效建模多说话者对话而设计。

Transformers 英语

Terjman Nano V2.0

Terjman-Nano-v2.0是基于Transformer架构的英语-摩洛哥方言翻译模型，参数规模77M，专为高质量精准翻译而优化。

Transformers 支持多种语言

Spec-Vision-V1是一款轻量级、最先进的开源多模态模型，专为深度整合视觉与文本数据而构建，支持128K的上下文长度。

文本生成图像

Transformers 其他

SVECTOR-CORPORATION

Spam Mail Classifier

基于microsoft/Multilingual-MiniLM-L12-H384微调的文本分类模型，用于将邮件主题分类为垃圾邮件(SPAM)或非垃圾邮件(NOSPAM)。

Segformer B0 512x1024 City 160k

基于Segformer架构的轻量级语义分割模型，预训练于Cityscapes数据集

Sapiens Depth 0.3b Torchscript

Sapiens 是一个基于 3 亿张 1024 x 1024 分辨率人类图像预训练的视觉变换器家族，用于深度估计任务。

采用3层Transformer架构的顶尖句子分割技术，支持多语言文本分割。

Transformers 支持多种语言

segment-any-text

sat-3l 是适用于 wtpsplit 的模型，采用 3 层 Transformer 架构，实现了最先进的句子分割功能。

Transformers 支持多种语言

segment-any-text

Meshgpt Preview

MeshGPT是基于自编码器和Transformer的文本生成3D模型，全球首个公开的3D模型分词器。

Octo小型版是一个用于机器人控制的扩散策略模型，采用Transformer架构，能够根据视觉输入和语言指令预测机器人动作。

多模态融合

Paraphrase MiniLM L6 V2 Finetune Summary

基于sentence-transformers的句子嵌入模型，可将文本映射到384维向量空间，适用于语义搜索和文本相似度计算

Sts Distilcamembert Base

这是一个基于DistilCamemBERT的法语句子嵌入模型，能够将句子或段落编码为768维向量，用于句子相似度计算等任务。

Transformers 法语

All MiniLM L6 V2 Sentiment Classifier

基于all-MiniLM-L6-v2架构的情感分类器，能识别六种基本情绪。

Transformers 英语

Simple Stories 4M

Simple Stories是一个基于TinyStories数据集训练的小型文本生成模型系列，专注于生成儿童故事。

Transformers 英语

Octo小型版是一个基于扩散策略训练的机器人控制模型，能够预测未来4步的7维动作，适用于多源机器人数据集。

多模态融合

CED是基于ViT-Transformer的简易音频标记模型，在Audioset上实现了最先进的性能表现。

T5 Translate Vietnamese Nom

基于Transformer架构的轻量级预训练模型，专为越南喃字与拉丁文字双向翻译设计

Transformers 其他

Mobilevitv2 1.0 Voc Deeplabv3

基于MobileViTv2架构的语义分割模型，在PASCAL VOC数据集上预训练，支持512x512分辨率图像处理

Segformer B0 Flair One

SegFormer是一种基于Transformer的高效语义分割模型，b0版本是其轻量级实现。

Internal.wav2vec2 Base Superb Ks Int8 Structured79

该模型是基于wav2vec2-base-ft-keyword-spotting在superb数据集上微调的版本，用于音频分类任务，经过量化和结构化剪枝优化。

Vit Small Patch16 224.dino

基于视觉Transformer（ViT）的图像特征模型，采用自监督DINO方法训练，适用于图像分类和特征提取任务。

T5 Small Vietnamese News

基于Transformer的轻量级预训练编码器-解码器模型，专为越南语新闻摘要设计

Transformers 其他

T5 Small Wikilingua Vietnamese

基于Transformer编码器-解码器架构的越南语最先进轻量级预训练模型，专注于文本摘要任务。

Transformers 其他

Nat Mini In1k 224

NAT-Mini 是基于邻域注意力机制的轻量级视觉Transformer模型，专为ImageNet图像分类任务设计

Transformers 其他

T5-small是基于编码器-解码器架构的预训练模型，通过统一文本到文本格式处理多种任务，支持多语言处理。

大型语言模型

Transformers 支持多种语言

LeViT-128S是基于ImageNet-1k数据集预训练的视觉Transformer模型，结合了卷积网络的优势以实现更快推理。

LeViT-384是基于ImageNet-1k数据集预训练的视觉Transformer模型，结合了卷积网络的优势以实现更快的推理速度。

HPD MiniLM F128

通过同态投影蒸馏压缩语义检索的句子表示模型，仅含2300万参数，模型大小87MB

Deit Small Patch16 224

DeiT是一种更高效训练的Vision Transformer模型，在ImageNet-1k数据集上以224x224分辨率预训练和微调，适用于图像分类任务。

Xtremedistil L12 H384 Uncased

XtremeDistilTransformers是一种经过蒸馏的任务无关Transformer模型，通过任务迁移学习小型通用模型，可应用于任意任务和语言。

大型语言模型

Transformers 英语

Xtremedistil L6 H384 Uncased

XtremeDistilTransformers是一种经过知识蒸馏的轻量级Transformer模型，具有任务无关性，可应用于多种自然语言处理任务。

大型语言模型英语

Fnet Base Finetuned Cola

基于google/fnet-base在GLUE COLA数据集上微调的文本分类模型，用于评估FNet与BERT架构的性能对比

Transformers 英语

Deit Tiny Patch16 224

DeiT是一种高效训练的视觉Transformer模型，在ImageNet-1k数据集上预训练和微调，适用于图像分类任务。

Minilm L12 H384 Uncased

MiniLM是一种小型高效的预训练语言模型，通过深度自注意力蒸馏技术压缩而成，适用于语言理解与生成任务。

大型语言模型

Multilingual MiniLM L12 H384

MiniLM是一种小型高效的预训练语言模型，通过深度自注意力蒸馏技术压缩Transformer模型，支持多语言理解与生成任务。

大型语言模型支持多种语言

Distil Eng Quora Sentence

这是一个基于sentence-transformers的句子嵌入模型，能够将句子映射到768维向量空间，适用于语义相似度计算和文本聚类等任务。

Xtremedistil L6 H256 Uncased

XtremeDistilTransformers是一个经过蒸馏的任务无关型Transformer模型，利用任务迁移学习技术训练小型通用模型，适用于多种任务和语言。

大型语言模型

Transformers 英语

Paraphrase Albert Small V2

这是一个基于ALBERT-small架构的句子转换器模型，能够将句子和段落映射到768维的向量空间，适用于句子相似度计算和语义搜索等任务。

Paraphrase Multilingual MiniLM L12 V2

这是一个多语言句子嵌入模型，可将文本映射至384维向量空间，适用于语义搜索和聚类任务。

Distilbert Base En Es It Cased

这是distilbert-base-multilingual-cased的精简版本，支持英语、西班牙语和意大利语处理，保持原始模型的准确度。

大型语言模型

Transformers 其他

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24