K

Kangaroo

由 KangarooGroup 开发
袋鼠是一个专为长视频理解设计的强大多模态大语言模型,支持中英双语对话和长视频输入。
下载量 163
发布时间 : 7/11/2024
模型介绍
内容详情
替代品

模型简介

袋鼠模型专注于视频理解任务,包括视频描述、问答和对话,特别擅长处理长视频输入,最大支持160帧。

模型特点

长视频输入支持
通过扩展至160帧输入能力,创新性地处理不同帧数和宽高比的视频
卓越性能表现
在多个视频理解基准测试中达到或超越SOTA水平
视频标注系统
开发了数据筛选与自动标注系统,生成大规模视频-文本数据集
双语对话能力
支持中英文双语单轮/多轮视频对话

模型能力

视频内容描述
视频问答
视频对话
长视频理解
中英双语处理

使用案例

视频内容分析
视频摘要生成
自动生成视频内容的文字摘要
可准确捕捉视频关键内容
智能客服
视频产品问答
回答用户关于视频中产品的各种问题
提供准确的产品信息解答