Phi-3.5-mini-ITA开源语言模型 - 优化意大利语性能，免费部署超实用

首页

Phi 3.5 Mini ITA

由 anakin87 开发

基于Microsoft/Phi-3.5-mini-instruct微调的版本，优化了意大利语性能的小型但强大的语言模型

大型语言模型

Transformers

支持多种语言开源协议:MIT #意大利语优化 #小参数高效 #128k长文本

下载量 8,495

发布时间 : 8/23/2024

模型简介

Phi-3.5-mini-ITA是一个针对意大利语优化的语言模型，基于Microsoft的Phi-3.5-mini-instruct微调而来，支持意大利语和英语，适用于文本生成任务。

模型特点

意大利语优化

专门针对意大利语性能进行了优化，在意大利语任务上表现优异

小巧高效

仅3.82亿参数，但性能强大，可在消费级硬件上运行

长上下文支持

支持128k的上下文长度，适合处理长文档

兼容Flash Attention 2

支持Flash Attention 2加速推理

模型能力

意大利语文本生成

英语文本生成

多轮对话

指令跟随

使用案例

教育

意大利语语法解释

解释意大利语语法规则，如时态区别

能准确解释未完成时和近过去时的区别及使用场景

聊天机器人

意大利语对话系统

构建意大利语聊天机器人

内容生成

意大利语内容创作

生成意大利语文章、故事等内容

🚀 Phi-3.5-mini-ITA

Phi-3.5-mini-ITA是Microsoft/Phi-3.5-mini-instruct的微调版本，针对意大利语进行了优化，性能更佳。

🔹 模型小巧但功能强大，拥有38.2亿个参数
🔹 支持128k的上下文长度
💬🇮🇹 在Hugging Face Spaces上与模型聊天
GGUF量化版本

🏋️‍♂️ 想了解该模型是如何训练的吗？ 查看📖 完整的详细文章和配套的💻 笔记本

Phi-3.5-mini-ITA

✨ 主要特性

小而强大：仅38.2亿参数，却能在意大利语任务中表现出色。
长上下文支持：支持128k的上下文长度，能处理更复杂的文本任务。
推理加速：兼容Flash Attention 2，可显著加速推理过程。

📚 详细文档

🏆 评估

Open ITA LLM Leaderboard

模型	参数数量	平均分	MMLU_IT	ARC_IT	HELLASWAG_IT
anakin87/Phi-3.5-mini-ITA	38.2亿	57.67	59.93	51.5	61.57
meta-llama/Meta-Llama-3.1-8B-Instruct	80.3亿	56.97	58.43	48.42	64.07
microsoft/Phi-3.5-mini-instruct	38.2亿	56.82	60.03	49.19	61.25

详情

Pinocchio ITA Leaderboard

模型	参数数量	平均分
anakin87/Phi-3.5-mini-ITA	38.2亿	57.95
meta-llama/Meta-Llama-3.1-8B-Instruct	80.3亿	56.93

详情

💻 使用示例

基础用法

该模型体积小巧，可在Colab上流畅运行，也可使用量化方式加载。使用transformers==4.44.2时，需要设置trust_remote_code=True以合并Phi3ForCausalLM中的一个小修复。更多详情请阅读此讨论。

⚡ 该模型兼容Flash Attention 2，可加速推理。若要启用，请取消代码片段中attn_implementation参数的注释。

# pip install transformers accelerate
import torch
from transformers import pipeline, AutoModelForCausalLM, AutoTokenizer

model_id="anakin87/Phi-3.5-mini-ITA"

model = AutoModelForCausalLM.from_pretrained(
    model_id, 
    device_map="auto",
    torch_dtype=torch.bfloat16,
    trust_remote_code=True,
    # attn_implementation="flash_attention_2",  # 取消注释以使用Flash Attention 2
)
tokenizer = AutoTokenizer.from_pretrained(model_id, trust_remote_code=True)

pipe = pipeline("text-generation", model=model, tokenizer=tokenizer)

user_input = "Puoi spiegarmi brevemente la differenza tra imperfetto e passato prossimo in italiano e quando si usano?"
messages = [{"role": "user", "content": user_input}]
outputs = pipe(user_input, max_new_tokens=500, do_sample=True, temperature=0.001)
print(outputs[0]["generated_text"])

示例输出：

Certamente! Imperfetto e passato prossimo sono due tempi verbali in italiano che si riferiscono a azioni passate, ma hanno sfumature diverse.

Imperfetto:
- L'imperfetto è usato per descrivere azioni o situazioni passate che erano continue o ripetute nel tempo.
- Indica un'azione senza una fine specifica o un'azione che si svolgeva abitualmente.
- È spesso usato per descrivere situazioni, condizioni o stati passati.
- Esempio: "Quando ero bambino, giocavo spesso nel parco."

Passato Prossimo:
- Il passato prossimo è usato per descrivere azioni passate che sono state completate o che hanno avuto una durata specifica.
- Indica un'azione che è avvenuta in un momento specifico nel passato.
- È spesso usato per descrivere eventi o azioni che hanno una durata definita o che si sono svolte in un momento specifico.
- Esempio: "Ieri ho finito il libro."

In sintesi, l'imperfetto si usa per azioni continue o abituali nel passato, mentre il passato prossimo si usa per azioni completate o avvenute in un momento specifico nel passato.