T

Tinyllava Video Coldstart NextQA 16

由 Zhang199 开发
TinyLLaVA-Video-R1 是一个视频文本到文本模型,通过使用来自NextQA数据集的16个手动标注样本对TinyLLaVA-Video进行冷启动训练获得。
下载量 63
发布时间 : 4/13/2025
模型介绍
内容详情
替代品

模型简介

该模型主要用于视频文本到文本的任务,是TinyLLaVA-Video-R1的基础模型。

模型特点

冷启动训练
使用来自NextQA数据集的16个手动标注样本进行冷启动训练。
轻量化
基于TinyLLaVA-Video模型,可能具有较小的模型尺寸和较高的效率。

模型能力

视频文本转换
文本生成

使用案例

视频理解
视频问答
基于视频内容生成回答