Q

Qwen2 72B Instruct 2.0bpw H Novel Exl2

由 Orion-zhen 开发
通义千问新一代72B参数大语言模型,支持131K长文本处理,在语言理解、文本生成、编程和数学推理等领域表现优异
下载量 21
发布时间 : 6/12/2024
模型介绍
内容详情
替代品

模型简介

Qwen2系列72B参数的指令微调版本,采用Transformer架构,支持超长文本处理和多语言交互

模型特点

超长上下文支持
通过YARN技术扩展至131,072 tokens上下文窗口,可处理长文档和复杂对话
多领域卓越表现
在MMLU、GPQA等学术基准及编程、数学推理任务中超越同类开源模型
量化适配
提供2比特量化版本,可在24G显存消费级显卡运行,优化小说生成领域性能

模型能力

长文本理解与生成
多轮对话
代码生成与解释
数学问题求解
多语言翻译
知识问答

使用案例

内容创作
小说生成
利用量化版本生成连贯的长篇叙事内容
经pixiv小说数据集优化,降低领域困惑度
智能助手
知识问答系统
部署为企业级知识库交互前端
在C-Eval中文评测达83.8分
教育
编程教学
实时代码解释与错误修正
HumanEval基准达86.0分