C

Clip Vit Base Patch32 Ko

由 Bingsu 开发
基于知识蒸馏训练的韩语CLIP模型,支持韩英双语图像-文本匹配任务
下载量 3,147
发布时间 : 9/16/2022
模型介绍
内容详情
替代品

模型简介

这是一个韩语版本的CLIP模型,基于ViT-Base-Patch32架构,通过知识蒸馏方法训练而成,专门用于处理韩语和英语的跨模态检索任务。

模型特点

韩语优化
专门针对韩语进行优化,使用AIHUB平台的韩英平行语料训练
知识蒸馏训练
采用知识蒸馏方法从原版CLIP模型迁移学习
双语支持
同时支持韩语和英语的文本输入

模型能力

零样本图像分类
图像-文本匹配
跨模态检索

使用案例

图像分类
动物识别
识别图像中的动物类型
能准确区分猫和狗等常见动物
内容审核
违规内容检测
检测图像中是否包含违规内容