TinyLlama-1.1B-32k开源模型 - 免费使用，处理超长上下文内容超给力

首页

Tinyllama 1.1B 32k

由 Doctor-Shotgun 开发

基于TinyLlama-1.1B的32k上下文微调版本，通过增大rope theta实现长上下文处理能力

大型语言模型

Transformers

英语开源协议:Apache-2.0 #长上下文推理 #推测解码优化 #高效微调

下载量 51

发布时间 : 12/29/2023

模型简介

这是一个针对长上下文优化的语言模型，通过调整rope频率基数实现32k上下文长度支持，适合作为推测解码模型使用

模型特点

长上下文支持

通过调整rope theta参数支持32k上下文长度

高效推理

量化版本可在单张A6000显卡上运行，适合推测解码

优化预训练

在RedPajama-Data-1T-Sample数据集上进行了32k上下文长度的预训练

模型能力

长文本生成

代码生成

文本理解

使用案例

代码生成

编程辅助

用于生成和补全代码

HumanEval评估显示Pass@1达到0.0829

长文本处理

长文档分析

处理长达32k token的文本内容

在32768长度下困惑度7.1338

模型	2048	4096	8192	16384	32768
TinyLlama-1.1B	8.5633	208.3586	863.7507	1600.5021	6981.9021
TinyLlama-1.1B-32k	8.6548	7.8339	7.4904	7.3674	7.1338

模型	Pass@1	Pass@10
TinyLlama-1.1B	0.0841	0.1524
TinyLlama-1.1B (NTK alpha=7.7)	0.0598	0.1098
TinyLlama-1.1B-32k-ckpt-554	0.0732	0.1402
TinyLlama-1.1B-32k	0.0829	0.1524

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文

Tinyllama 1.1B 32k

模型简介

模型特点

模型能力

使用案例

🚀 TinyLlama-1.1B-32k

✨ 主要特性

模型评估

Wikitext 数据集困惑度（wikitext-2-raw-v1_train，64 行），通过 exllamav2 评估：

由 turboderp 在 HumanEval 数据集上的评估：

📄 许可证