M

Minicpm 2B Sft Fp32

由 openbmb 开发
MiniCPM 是面壁智能与清华大学自然语言处理实验室共同开源的系列端侧语言大模型,主体语言模型 MiniCPM-2B 仅有 24亿(2.4B)的非词嵌入参数量。
下载量 218
发布时间 : 1/30/2024
模型介绍
内容详情
替代品

模型简介

MiniCPM 是面向端侧的高效语言大模型,经过监督微调(SFT)和直接偏好优化(DPO)后,在多项评测中表现优异,支持中英文,可在手机端部署。

模型特点

端侧高效部署
经过 Int4 量化后可在手机上进行部署推理,流式输出速度略高于人类说话速度。
性能优异
在公开评测中表现与 Mistral-7B 相近,整体性能超越 Llama2-13B、MPT-30B、Falcon-40B 等模型。
多模态支持
基于 MiniCPM-2B 构建的端侧多模态大模型 MiniCPM-V,性能超越同规模模型。
低成本开发
仅需一张1080/2080显卡即可高效进行参数高效微调,二次开发成本较低。

模型能力

文本生成
对话系统
多模态理解
代码生成
数学推理

使用案例

智能助手
问答系统
回答用户提出的各种问题
在中文、数学、代码能力上表现优异
教育
学习辅助
帮助学生解答学习问题
在数学推理能力上表现良好
开发辅助
代码生成
辅助开发者生成代码片段
在代码能力评测中表现优异