Phi-4-mini-instruct开源轻量级模型 - 支持多语言，超长上下文推理必备

首页

Phi 4 Mini Instruct

由 microsoft 开发

Phi-4-mini-instruct是一个轻量级开源模型，基于合成数据和过滤后的公开网站数据构建，专注于高质量、富含推理能力的数据。支持128K令牌的上下文长度和多语言处理。

大型语言模型

Transformers

支持多种语言开源协议:MIT #轻量级推理 #多语言指令 #128K长文本

下载量 346.30k

发布时间 : 2/19/2025

模型简介

该模型通过监督微调和直接偏好优化增强，能够精确遵循指令并具备强大的安全措施，适用于商业和研究用途，特别适合内存/计算受限环境及需要强大推理能力的应用。

模型特点

轻量高效

3.8B参数的轻量级设计，适合内存和计算资源受限的环境。

强大推理能力

专注于数学和逻辑推理能力，在多个基准测试中表现优异。

多语言支持

支持23种语言的处理和理解。

长上下文处理

支持128K令牌的上下文长度，适合处理长文档和复杂对话。

安全措施

经过直接偏好优化，具备强大的安全防护能力。

模型能力

文本生成

多语言处理

数学推理

逻辑推理

指令遵循

代码生成

使用案例

商业应用

客户服务助手

用于处理多语言客户查询，提供快速准确的响应。

提高客户满意度，降低响应时间

数据分析报告生成

根据结构化数据自动生成分析报告。

节省人工报告编写时间

研究应用

数学问题求解

用于解决数学问题和验证数学猜想。

在GSM8K等数学基准上表现优异

代码生成与补全

辅助程序员编写和优化代码。

在HumanEval等代码基准上表现良好

🚀 Phi-4

Phi-4是一系列强大的模型，涵盖了多种变体，如推理、多模态指令、迷你指令等版本，还支持ONNX格式。它基于合成数据和高质量公开网站数据构建，专注于推理密集型任务，支持128K token上下文长度，在多语言商业和研究领域有广泛应用。

🚀 快速开始

你可以通过以下链接尝试使用Phi-4模型：

✨ 主要特性

多语言支持：支持阿拉伯语、中文、捷克语等多种语言。
轻量级设计：适合内存/计算受限环境和低延迟场景。
强大推理能力：在数学和逻辑推理方面表现出色。
长上下文支持：支持128K token上下文长度。

📦 安装指南

使用vLLM进行推理

所需包

flash_attn==2.7.4.post1
torch==2.5.1
vllm>=0.7.3

示例代码

from vllm import LLM, SamplingParams

llm = LLM(model="microsoft/Phi-4-mini-instruct", trust_remote_code=True)

messages = [
    {"role": "system", "content": "You are a helpful AI assistant."},
    {"role": "user", "content": "Can you provide ways to eat combinations of bananas and dragonfruits?"},
    {"role": "assistant", "content": "Sure! Here are some ways to eat bananas and dragonfruits together: 1. Banana and dragonfruit smoothie: Blend bananas and dragonfruits together with some milk and honey. 2. Banana and dragonfruit salad: Mix sliced bananas and dragonfruits together with some lemon juice and honey."},
    {"role": "user", "content": "What about solving an 2x + 3 = 7 equation?"},
]

sampling_params = SamplingParams(
  max_tokens=500,
  temperature=0.0,
)

output = llm.chat(messages=messages, sampling_params=sampling_params)
print(output[0].outputs[0].text)

使用Transformers进行推理

所需包

flash_attn==2.7.4.post1
torch==2.5.1
transformers==4.49.0
accelerate==1.3.0

示例代码

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline

torch.random.manual_seed(0)

model_path = "microsoft/Phi-4-mini-instruct"

model = AutoModelForCausalLM.from_pretrained(
    model_path,
    device_map="auto",
    torch_dtype="auto",
    trust_remote_code=True,
)
tokenizer = AutoTokenizer.from_pretrained(model_path)

messages = [
    {"role": "system", "content": "You are a helpful AI assistant."},
    {"role": "user", "content": "Can you provide ways to eat combinations of bananas and dragonfruits?"},
    {"role": "assistant", "content": "Sure! Here are some ways to eat bananas and dragonfruits together: 1. Banana and dragonfruit smoothie: Blend bananas and dragonfruits together with some milk and honey. 2. Banana and dragonfruit salad: Mix sliced bananas and dragonfruits together with some lemon juice and honey."},
    {"role": "user", "content": "What about solving an 2x + 3 = 7 equation?"},
]

pipe = pipeline(
    "text-generation",
    model=model,
    tokenizer=tokenizer,
)

generation_args = {
    "max_new_tokens": 500,
    "return_full_text": False,
    "temperature": 0.0,
    "do_sample": False,
}

output = pipe(messages, **generation_args)
print(output[0]['generated_text'])

💻 使用示例

输入格式

聊天格式

<|system|>Insert System Message<|end|><|user|>Insert User Message<|end|><|assistant|>

工具启用的函数调用格式

<|system|>You are a helpful assistant with some tools.<|tool|>[{"name": "get_weather_updates", "description": "Fetches weather updates for a given city using the RapidAPI Weather API.", "parameters": {"city": {"description": "The name of the city for which to retrieve weather information.", "type": "str", "default": "London"}}}]<|/tool|><|end|><|user|>What is the weather like in Paris today?<|end|><|assistant|>

📚 详细文档

预期用途

主要用例

该模型适用于广泛的多语言商业和研究用途，可用于以下场景：

内存/计算受限的环境。
低延迟场景。
需要强大推理能力（特别是数学和逻辑推理）的通用AI系统和应用。

使用案例考虑因素

开发者在选择使用案例时，应考虑语言模型的常见局限性以及不同语言之间的性能差异，并在特定下游用例中使用之前评估和缓解准确性、安全性和公平性问题，特别是在高风险场景中。同时，开发者应遵守适用的法律法规。

发布说明

本次发布的Phi-4-mini-instruct基于Phi-3系列的用户反馈，采用了新架构、更大的词汇表和更好的训练后技术，在关键能力上有显著提升。建议用户在特定AI应用中进行测试。

模型质量

通过内部基准平台对Phi-4-mini-instruct模型与一组模型在各种基准测试中进行了比较，结果显示该模型在多语言理解和推理能力方面达到了与更大模型相似的水平，但在某些任务上仍受限于其规模。

负责任的AI考虑

开发者应应用负责任的AI最佳实践，包括评估和缓解与特定用例和文化、语言背景相关的风险。在部署模型时，应考虑模型在资源分配、高风险场景、错误信息、有害内容生成和滥用等方面的适用性。

训练

模型信息

属性	详情
模型类型	基于Transformer的轻量级开放模型
输入	文本，适合聊天格式的提示
上下文长度	128K tokens
GPU	512 A100-80G
训练时间	21天
训练数据	5T tokens
输出	生成的文本
训练日期	2024年11月至12月
状态	基于2024年6月截止的离线数据集训练的静态模型
支持语言	阿拉伯语、中文、捷克语、丹麦语、荷兰语、英语、芬兰语、法语、德语、希伯来语、匈牙利语、意大利语、日语、韩语、挪威语、波兰语、葡萄牙语、俄语、西班牙语、瑞典语、泰语、土耳其语、乌克兰语
发布日期	2025年2月