Cockatiel - 8B开源视频字幕生成模型，为视频生成符合人类偏好的详细字幕

首页

Cockatiel 8B

由 Fr0zencr4nE 开发

基于VILA-v1.5-8B构建的视频字幕生成模型，能够为输入视频生成详细且符合人类偏好的字幕。

视频生成文本

Transformers

#视频详细字幕生成 #人类偏好优化 #多模态理解

下载量 19

发布时间 : 3/12/2025

模型简介

该模型通过合成数据与人类偏好训练集成实现精细视频字幕生成，适用于需要高质量视频描述的场景。

模型特点

精细视频字幕生成

能够为输入视频生成详细且符合人类偏好的字幕。

合成数据与人类偏好训练

通过合成数据与人类偏好训练集成实现高质量字幕生成。

基于VILA-v1.5-8B构建

基于强大的VILA-v1.5-8B模型构建，具有竞争力的性能。

模型能力

视频字幕生成

多模态理解

详细描述生成

使用案例

视频内容理解

视频字幕生成

为输入视频生成详细且符合人类偏好的字幕。

高质量的视频描述，适用于视频内容理解与检索。

多模态应用

视频内容分析

结合视频与文本信息进行内容分析。

提升视频内容理解的准确性与详细程度。

属性	详情
模型类型	视频文本到文本生成模型
训练数据	未提及

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文

Cockatiel 8B

模型简介

模型特点

模型能力

使用案例

🚀 鹦鹉视频字幕生成模型（Cockatiel）

🚀 快速开始

📄 许可证

📋 模型信息