C

CAI Supernova R2

由 Edens-Gate 开发
该模型是基于arcee-ai/Llama-3.1-SuperNova-Lite在CharacterAI-logs和OpenCAI-ShareGPT数据集上进行微调的版本,支持长上下文处理。
下载量 43
发布时间 : 10/23/2024
模型介绍
内容详情
替代品

模型简介

一个经过微调的大语言模型,专注于对话生成任务,支持16384的序列长度。

模型特点

长上下文支持
支持16384的序列长度,适合处理长文本和复杂对话场景
高效优化
使用LigerPlugin进行多项优化,包括rope、rms_norm和swiglu等技术
对话微调
在CharacterAI和ShareGPT对话数据集上进行专门微调

模型能力

文本生成
对话系统
长文本处理

使用案例

对话系统
智能聊天机器人
可用于构建具有长对话记忆能力的聊天机器人
内容生成
长文本生成
适合生成需要长上下文连贯性的内容