P

Phi 4 Mini Instruct 8da4w

由 pytorch 开发
Phi-4-mini 是由 PyTorch 团队开发的量化语言模型,采用8位嵌入和8位动态激活,以及4位权重线性层(8da4w)的量化方案,适合移动端部署。
下载量 780
发布时间 : 4/7/2025
模型介绍
内容详情
替代品

模型简介

Phi-4-mini 是一个轻量级的自然语言处理模型,适用于代码生成、数学推理、聊天对话等多种任务。

模型特点

高效量化
采用8位嵌入和8位动态激活,以及4位权重线性层(8da4w)的量化方案,显著减少模型大小和内存占用。
移动端部署
支持通过 ExecuTorch 在移动设备上运行,适合资源受限的环境。
高性能推理
在 iPhone 15 Pro 上,模型运行速度为每秒17.3个令牌,内存占用为3206 MB。

模型能力

文本生成
代码生成
数学推理
聊天对话

使用案例

自然语言处理
聊天机器人
用于构建高效的聊天机器人,支持多轮对话。
响应速度快,适合移动端应用。
代码辅助
帮助开发者生成代码片段或解决编程问题。
支持多种编程语言,生成质量较高。
教育
数学辅导
用于解答数学问题或提供解题思路。
在 GSM8K 数据集上表现良好。