多语言视觉语言

# 多语言视觉语言

Vit Gopt 16 SigLIP2 384

基于WebLI数据集训练的SigLIP 2视觉语言模型，支持零样本图像分类

文本生成图像

Vit Gopt 16 SigLIP2 256

基于WebLI数据集训练的SigLIP 2视觉语言模型，适用于零样本图像分类任务。

文本生成图像

Vit SO400M 16 SigLIP2 512

基于WebLI数据集训练的SigLIP 2视觉语言模型，适用于零样本图像分类任务

文本生成图像

Vit SO400M 16 SigLIP2 384

基于WebLI数据集训练的SigLIP 2视觉语言模型，支持零样本图像分类任务。

文本生成图像

Vit SO400M 16 SigLIP2 256

基于WebLI数据集训练的SigLIP 2视觉语言模型，支持零样本图像分类

文本生成图像

Vit SO400M 14 SigLIP2 378

基于WebLI数据集训练的SigLIP 2视觉语言模型，支持零样本图像分类任务

文本生成图像

Vit L 16 SigLIP2 512

基于WebLI数据集训练的SigLIP 2视觉语言模型，支持零样本图像分类任务

文本生成图像

Vit L 16 SigLIP2 384

一个在WebLI数据集上训练的SigLIP 2视觉语言模型，适用于零样本图像分类任务。

文本生成图像

Vit L 16 SigLIP2 256

基于WebLI数据集训练的SigLIP 2视觉语言模型，支持零样本图像分类

文本生成图像

Vit B 16 SigLIP2 512

基于WebLI数据集训练的SigLIP 2视觉语言模型，支持零样本图像分类任务

文本生成图像

Vit B 16 SigLIP2 384

基于WebLI数据集训练的SigLIP 2视觉语言模型，适用于零样本图像分类任务

文本生成图像

Vit B 16 SigLIP2

基于WebLI数据集训练的SigLIP 2视觉语言模型，适用于零样本图像分类任务。

文本生成图像

Vit B 32 SigLIP2 256

基于WebLI数据集训练的SigLIP 2视觉语言模型，支持零样本图像分类任务

文本生成图像

Vit B 16 SigLIP2 256

基于WebLI数据集训练的SigLIP 2视觉语言模型，支持零样本图像分类任务

文本生成图像

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24