V

Vicuna 68m

由 double7 开发
这是一个6800万参数的类Vicuna模型,基于LLaMA-68m在ShareGPT数据上微调,主要用于作为推测模型开发。
下载量 1,935
发布时间 : 1/11/2024
模型介绍
内容详情
替代品

模型简介

该模型是基于LLaMA-68m架构在ShareGPT对话数据上微调的小型语言模型,旨在保持与LLaMA和Vicuna模型的对齐性,特别适合作为推测模型使用。

模型特点

小型高效
仅6800万参数,计算资源需求低,适合作为推测模型使用
双重对齐
同时保持与LLaMA和Vicuna模型的对齐性
对话优化
在ShareGPT对话数据上微调,适合对话生成任务

模型能力

文本生成
对话生成
语言理解

使用案例

推测解码
MCSD论文中的基础模型
作为小型推测模型与大型目标模型配合使用
相比原始LLaMA-68m,能更好地与Vicuna模型对齐
对话系统
轻量级对话代理
适用于资源受限环境下的对话生成