零样本学习

# 零样本学习

Siglip So400m Patch14 378 From Llava Onevision Qwen2 7b Si Hf

这是一个自动生成的Hugging Face Transformers模型卡片，具体模型信息待补充。

大型语言模型

Qwen3 1.7b Reasoning DPO

这是一个自动生成的 🤗 Transformers 模型卡片，具体信息待补充

大型语言模型

Clip Finetuned Deepfashion

这是一个自动生成的🤗 Transformers模型卡片，缺少具体模型信息。

大型语言模型

这是一个Hugging Face模型中心的Transformer模型，具体信息待补充

大型语言模型

GME VARCO VISION Embedding

GME-VARCO-VISION-Embedding是一个多模态嵌入模型，专注于在高维嵌入空间中计算文本、图像和视频之间的语义相似度，尤其擅长视频检索任务。

多模态融合

Transformers 英语

The Teacher V 2

基于Transformers架构的零样本分类模型，无需微调即可对文本进行分类

大型语言模型

这是一个自动生成的transformers模型卡片，具体信息待补充。

大型语言模型

Sarvam Finetune

这是一个发布在Hub上的transformers模型，具体功能和详细信息待补充。

大型语言模型

Um P2 Fine Tuned Llama Full 2

这是一个已推送到Hub上的transformers模型，具体功能和用途待补充。

大型语言模型

Nalgotic Dreams 是一个基于稳定扩散XL的文本生成图像模型，专注于生成高质量的动漫风格图像，特别是明亮、精细的插画风格女孩形象。

图像生成英语

应龙是一个用于时间序列预测的预训练模型，在780亿个时间点上进行了预训练，为时间序列预测任务提供强大支持。

应龙是一款用于时间序列预测的基础模型，预训练于78B时间点，为时间序列预测任务提供强大支持。

Magma-8B是一个基于GGUF格式的图像文本到文本转换模型，适用于多模态任务处理。

图像生成文本

GPT-2是由OpenAI开发的开源语言模型，基于Transformer架构，能够生成连贯的文本。

大型语言模型英语

Transformers 是一个由 Hugging Face 开发的开源库，提供多种预训练模型，用于自然语言处理任务。

大型语言模型

Xlm Roberta Large Pooled Cap Media Minor

基于xlm-roberta-large模型微调的多语言文本分类模型，支持英语和丹麦语，专注于政治议程和媒体内容的分类任务。

Openvision Vit Small Patch8 384

OpenVision是一个全开放、高性价比的先进视觉编码器家族，专注于多模态学习。

多模态融合

Openvision Vit Small Patch16 224

OpenVision是一个全开放、高性价比的先进视觉编码器家族，专注于多模态学习。

Openvision Vit Tiny Patch8 224

OpenVision是一个全开放、高性价比的先进视觉编码器家族，专注于多模态学习。

多模态融合

Openvision Vit Tiny Patch16 384

OpenVision是一个全开放、高性价比的先进视觉编码器家族，专注于多模态学习。

图像特征提取

Bart Large Empathetic Dialogues

该模型是一个基于transformers库的模型，具体用途和功能需要进一步的信息来确定。

大型语言模型

Falcon H1 1.5B Deep Base

Falcon-H1是由TII开发的高效混合架构语言模型，结合Transformer与Mamba架构，支持多语言任务

大型语言模型

Transformers 支持多种语言

Openbioner Base

OpenBioNER 是一款专为开放领域生物医学命名实体识别（NER）定制的轻量级 BERT 模型，仅需目标实体类型的自然语言描述即可识别未见过的实体类型，无需重新训练。

Zero Mistral 24B

Zero-Mistral-24B是基于Mistral-Small-3.1-24B-Instruct-2503改进的纯文本模型，主要适配俄语和英语，移除了原版的视觉功能，专注于文本生成任务。

大型语言模型

Transformers 支持多种语言

XGLM-564M 是一个多语言自回归语言模型，包含5.64亿参数，基于30种语言的平衡语料库训练，总计5000亿子词。

大型语言模型支持多种语言

这是一个托管在Hugging Face Hub上的transformers模型，具体功能和用途需要进一步补充信息。

大型语言模型

CLIP ViT L Rho50 K1 Constrained FARE2

基于openai/clip-vit-large-patch14微调的特征提取模型，优化了图像和文本编码器

多模态融合

THUDM.GLM 4 32B 0414 GGUF

GLM-4-32B-0414是由THUDM开发的大规模语言模型，具有320亿参数，适用于多种文本生成任务。

大型语言模型

Style 250412.vit Base Patch16 Siglip 384.v2 Webli

基于Vision Transformer架构的视觉模型，采用SigLIP（Sigmoid Loss for Language-Image Pretraining）训练方法，适用于图像理解任务。

Llama 4 Scout 17B 16E Instruct Q8 0

Llama-4-Scout-17B-16E-Instruct 是一个由 Meta 发布的大型语言模型，专注于指令遵循任务，适用于多种文本生成场景。

大型语言模型

Xlm Roberta Large Pooled Cap Minor

基于xlm-roberta-large微调的多语言文本分类模型，用于比较议程项目的次要主题代码分类

PURE是首个采用多模态大型语言模型（MLLM）作为主干网络来解决低级视觉任务的框架。

这是Facebook SAM模型（sam-vit-base）的改进版本，专为CVAT中的图像分割任务优化配置。

图像分割支持多种语言

Quantum_STT 是一种先进的自动语音识别（ASR）和语音翻译模型，基于大规模弱监督训练，支持多种语言和任务。

Transformers 支持多种语言

Gemma 3 4b It Gguf

基于Google基础模型的文本或图文到文本生成模型，支持GGUF格式。

大型语言模型

Kok-Base 是一个多语言模型，支持英语、阿拉伯语和捷克语，适用于多种自然语言处理任务。

大型语言模型

Transformers 支持多种语言

Qwen.qwen2.5 VL 72B Instruct GGUF

Qwen2.5-VL-72B-Instruct是通义千问团队开发的大规模视觉语言模型，支持图像和文本的多模态理解与生成。

图像生成文本

Internvl2 5 HiMTok 8B

HiMTok是一个基于InternVL2_5-8B大型多模态模型微调的分层掩码标记学习框架，专注于图像分割任务。

图像生成文本

Llama 3.1 8B AthenaSky MegaMix

通过MergeKit融合多个高质量模型的8B参数大语言模型，优化了推理、对话和创意生成能力

大型语言模型

Transformers 英语

Ibm Granite.granite Vision 3.2 2b GGUF

Granite Vision 3.2 2B 是 IBM 开发的一个视觉语言模型，专注于图像文本转文本任务。

图像生成文本

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24