S

Smolvlm 500M Anime Caption V0.1

由 Andres77872 开发
专注于描述动漫风格图像的视觉语言模型,基于SmolVLM-500M-Base微调,训练数据包含18万组由大语言模型生成的合成图像/字幕对。
下载量 61
发布时间 : 4/18/2025
模型介绍
内容详情
替代品

模型简介

专为高效生成高质量的动漫风格图像字幕而设计,能为各类动漫作品和插画生成自然流畅的英文描述。

模型特点

动漫图像专用
专门针对动漫风格图像优化,能准确捕捉动漫特有的视觉特征和风格元素。
高质量合成数据训练
使用最新大语言模型(Gemma 3、Gemini 2.0 Flash等)生成的18万组高质量合成数据训练。
轻量高效
基于500M参数的轻量级模型,在保持性能的同时实现高效推理。

模型能力

动漫图像描述生成
动漫内容索引与标记
动漫风格识别

使用案例

动漫内容创作
动漫作品自动字幕
为动漫作品和插画自动生成英文描述字幕
自然流畅的动漫风格描述
动漫资料库标注
用于动漫资料库和数据库的内容自动标注
提高内容检索效率