C

Cocom V1 128 Mistral 7b

由 naver 开发
COCOM是一种高效的上下文压缩方法,能将长上下文压缩为少量上下文嵌入,显著加速问答任务的生成时间。
下载量 53
发布时间 : 10/15/2024
模型介绍
内容详情
替代品

模型简介

COCOM是一种用于检索增强生成(RAG)的上下文压缩方法,通过将长上下文压缩为少量上下文嵌入来提升生成速度,支持不同压缩率以实现解码时间和答案质量的灵活权衡。

模型特点

高效上下文压缩
将长上下文压缩为少量上下文嵌入,显著减少解码时间。
灵活压缩率
支持不同压缩率,可在解码时间和答案质量之间灵活权衡。
多上下文处理
能高效处理多上下文场景,大幅降低长输入的解码耗时。

模型能力

上下文压缩
问答生成
检索增强生成

使用案例

信息检索与问答
影视人物问答
基于多段上下文信息快速生成准确答案。
在保持高性能的同时,速度提升最高达5.69倍。