M

Minicpm4 8B GGUF

由 Mungert 开发
MiniCPM4-8B是专为端侧设备设计的高效大语言模型,通过模型架构、训练数据、训练算法和推理系统四个维度的创新,实现了极致的效率提升。
下载量 906
发布时间 : 6/13/2025

模型简介

MiniCPM4-8B是一个80亿参数的大语言模型,在8T个token上进行训练,专为边缘设备优化,支持高达32,768个token的上下文长度,并可通过RoPE缩放技术扩展至131,072个token。

模型特点

高效稀疏注意力机制
采用InfLLM v2可训练的稀疏注意力机制,在处理128K长文本时每个token只需与不到5%的token计算相关性,显著减少计算开销。
极致量化技术
支持BitCPM极致三元量化,将模型参数压缩为三元值,实现90%的比特宽度减少。
长上下文支持
原生支持32,768个token上下文长度,通过LongRoPE技术可扩展至131,072个token。
端侧优化
专为边缘设备设计,在典型端侧芯片上可实现超过5倍的生成加速。

模型能力

长文本生成
多轮对话
知识密集型任务处理
推理密集型任务处理
工具调用

使用案例

内容生成
文章写作
根据用户提示生成高质量的长篇文章
可生成结构完整、逻辑清晰的专业文章
智能助手
旅游推荐
为用户推荐旅游景点并提供详细介绍
能生成包含多个景点的详细推荐列表
学术研究
文献综述
根据用户查询自主生成可信的长篇调查论文
可生成结构完整的学术综述
AIbase
智启未来,您的人工智能解决方案智库
简体中文