C

Cocom V1 4 Mistral 7b

由 naver 开发
COCOM 是一种高效的上下文压缩方法,能够将长上下文压缩为少量上下文嵌入,从而加速问答任务的生成时间。
下载量 17
发布时间 : 10/14/2024
模型介绍
内容详情
替代品

模型简介

COCOM 是一种用于检索增强生成(RAG)的高效上下文压缩方法,通过将长上下文压缩为少量上下文嵌入来加速生成时间,支持不同的压缩率以实现解码时间和答案质量的权衡。

模型特点

高效的上下文压缩
将长上下文压缩为少量上下文嵌入,显著减少解码时间。
支持多上下文处理
能够高效处理多个上下文,适用于复杂的问答场景。
可调节的压缩率
支持不同的压缩率,用户可以在解码时间和答案质量之间进行权衡。

模型能力

上下文压缩
问答生成
检索增强生成(RAG)

使用案例

信息检索与问答
影视角色查询
快速回答关于影视剧中角色扮演者的问题。
相比现有方法,最高实现5.69倍的加速。