P

Phi 4 Mini Instruct Float8dq

由 pytorch 开发
Phi-4-mini-instruct模型经torchao进行float8动态激活和权重量化,在H100上实现36%显存降低和15-20%速度提升,几乎不影响精度。
下载量 1,006
发布时间 : 4/8/2025
模型介绍
内容详情
替代品

模型简介

基于Microsoft Phi-4-mini-instruct的量化版本,适用于文本生成任务,支持多语言交互和数学推理。

模型特点

高效量化
采用float8动态激活和权重量化技术,显著降低显存占用
性能优化
在H100上实现15-20%推理速度提升
多任务支持
支持代码生成、数学推理和对话任务
精度保留
量化后模型精度损失极小(基准测试显示总体表现仅下降0.24%)

模型能力

文本生成
数学问题求解
代码生成
多语言对话
逻辑推理

使用案例

教育辅助
数学解题
帮助学生理解代数方程解法
可正确解答2x+3=7类方程
创意生成
食谱建议
生成水果搭配创意食谱
提供香蕉火龙果奶昔等具体方案
技术问答
编程帮助
解释代码逻辑或生成代码片段