chinese-llama-2-7b-16k开源中文大模型 - 支持16K上下文推理与全参数训练

首页

Chinese Llama 2 7b 16k

由 hfl 开发

Chinese-LLaMA-2-7B-16K是基于Meta发布的Llama-2开发的中文大模型，支持16K上下文长度，适用于推理和全参数训练。

大型语言模型

Transformers

支持多种语言开源协议:Apache-2.0 #长上下文处理 #中英双语支持 #全参数可训练

下载量 57

发布时间 : 8/25/2023

模型简介

这是一个完整的中文LLaMA-2-7B-16K模型，可直接加载用于推理和全参数训练。模型在原有Llama-2的基础上扩充并优化了中文词表，使用了大规模中文数据进行增量预训练，提升了中文基础语义理解能力。

模型特点

长上下文支持

支持16K上下文长度，通过NTK方法可扩展至18K+

中文优化

扩充并优化了中文词表，使用大规模中文数据进行增量预训练

多用途

可直接用于推理和全参数训练

兼容性强

支持LLaMA生态系统的多种工具，如transformers、llama.cpp等

模型能力

文本生成

语义理解

长文本处理

指令跟随

使用案例

自然语言处理

中文文本生成

生成高质量的中文文本内容

生成流畅、符合语义的中文文本

长文档处理

处理和分析长文档内容

有效理解和处理长达16K的文本内容

教育

智能问答

构建教育领域的智能问答系统

提供准确、相关的知识解答

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文

Chinese Llama 2 7b 16k

模型简介

模型特点

模型能力

使用案例

🚀 中文LLaMA-2-7B-16K

🚀 快速开始

相关模型👇

长上下文基础模型（16K）

长上下文指令/对话模型

基础模型

指令/对话模型

✨ 主要特性

📄 许可证