E

EXAONE Deep 2.4B GGUF

由 Mungert 开发
EXAONE Deep是由LG AI Research开发的高效推理语言模型,参数规模2.4B,在数学和编程等推理任务中表现优异。
下载量 968
发布时间 : 3/19/2025
模型介绍
内容详情
替代品

模型简介

EXAONE Deep是一个专注于推理能力的语言模型系列,该2.4B版本在保持较小参数规模的同时实现了出色的推理性能。

模型特点

高效推理能力
在数学和编程等推理任务中表现优异,超越同等规模模型
优化的架构设计
采用GQA架构(32个Q头和8个KV头),平衡计算效率和模型性能
长上下文支持
支持32,768个token的上下文长度,适合处理长文档
多格式支持
提供BF16、F16及多种量化版本,适应不同硬件需求

模型能力

数学推理
编程代码生成
长文本处理
多语言文本生成

使用案例

教育
数学问题解答
解决高中数学竞赛级别的问题
在AIME数学竞赛测试中表现优异
编程
代码生成与补全
根据自然语言描述生成编程代码
在Live Code Bench测试中达到59.5%通过率