M

Minicpm3 4B

由 openbmb 开发
MiniCPM3-4B是MiniCPM系列第三代模型,整体性能超越Phi-3.5-mini-Instruct和GPT-3.5-Turbo-0125,与近期多个7B~9B量级模型表现相当。
下载量 15.94k
发布时间 : 9/3/2024
模型介绍
内容详情
替代品

模型简介

MiniCPM3-4B具备更强大的多维度能力以实现通用场景应用,支持函数调用及代码解释器功能,具有32k上下文窗口。结合LLMxMapReduce技术,理论上可处理无限长文本且无需消耗大量内存。

模型特点

高性能
整体性能超越Phi-3.5-mini-Instruct和GPT-3.5-Turbo-0125,与近期多个7B~9B量级模型表现相当。
多功能支持
支持函数调用及代码解释器功能,具备更强大的多维度能力以实现通用场景应用。
长文本处理
具有32k上下文窗口,结合LLMxMapReduce技术,理论上可处理无限长文本且无需消耗大量内存。

模型能力

文本生成
函数调用
代码解释
长文本处理
多语言支持

使用案例

通用问答
旅游推荐
为用户推荐旅游景点
能够生成符合用户需求的景点推荐列表
编程辅助
代码生成
根据需求生成代码片段
在HumanEval+测试中获得68.3分
数学问题解答
数学计算
解决各类数学问题
在GSM8K测试中获得81.1分