maestrale-chat-v0.4-beta开源意大利语聊天模型 - 经大规模语料训练高效对话

首页

Maestrale Chat V0.4 Beta

由 mii-llm 开发

基于 Mistral-7b 的意大利语聊天模型，经过大规模意大利语语料库预训练和微调

大型语言模型

Transformers

其他#意大利语对话 #多轮SFT微调 #DPO对齐

下载量 6,555

发布时间 : 6/6/2024

模型简介

这是一个意大利语聊天模型，基于 Mistral-7b 架构，经过专门的意大利语预训练和指令微调，具备对话、推理和多种专业任务处理能力。

模型特点

意大利语优化

专门针对意大利语进行了大规模预训练和微调

多轮对话能力

在170万对话/指令数据上进行了2轮SFT微调

DPO对齐

使用多个数据集通过DPO进行对齐训练

多功能支持

支持思维导图生成、SQL转换、文章撰写等多种专业任务

模型能力

意大利语对话

文本生成

指令跟随

思维导图生成

SQL查询转换

文章撰写

数学推理

拉丁语翻译

诗歌创作

使用案例

教育

语言学习辅助

帮助学习意大利语的学生进行对话练习

拉丁语翻译

提供拉丁语到意大利语的翻译服务

商业

数据库查询

将自然语言问题转换为SQL查询

创意写作

诗歌创作

根据主题生成意大利语诗歌

文章撰写

根据目录结构自动生成完整文章

🚀 Maestrale chat beta ༄

Maestrale chat beta 是一款专为意大利语设计的语言模型，通过在精心策划的大规模高质量语料库上进行持续预训练，并结合了SFT和DPO微调技术，在多个任务上展现出了良好的性能。它能处理多种复杂的任务，如生成Mermaid思维导图、SQL查询语句和文章等。

✨ 主要特性

语言模型：基于Mistral - 7b的意大利语模型，在精心挑选的大规模高质量意大利语语料库上进行持续预训练，并与 occiglot 合并。
微调：在170万个对话/指令上进行了2个轮次的SFT微调。
DPO对齐：在多个数据集上使用DPO进行对齐。
v0.4版本更新：
- 新增Agent功能。
- 提高了回答的真实性。
- 增强了数学和推理能力。
- 支持Mermaid思维导图。
- 提供更多拉丁语翻译、诗歌等内容。

📦 安装指南

文档未提供具体安装步骤，暂不展示安装指南相关内容。

💻 使用示例

基础用法

from transformers import (
    AutoTokenizer, 
    AutoModelForCausalLM, 
    GenerationConfig,
    TextStreamer
)
import torch

tokenizer = AutoTokenizer.from_pretrained("mii-llm/maestrale-chat-v0.4-beta")
model = AutoModelForCausalLM.from_pretrained("mii-llm/maestrale-chat-v0.4-beta", load_in_8bit=True, device_map="auto")

gen = GenerationConfig(
    do_sample=True,
    temperature=0.7,
    repetition_penalty=1.2,
    top_k=50,
    top_p=0.95,
    max_new_tokens=500,
    pad_token_id=tokenizer.eos_token_id,
    eos_token_id=tokenizer.convert_tokens_to_ids("<|im_end|>")
)

streamer = TextStreamer(tokenizer, skip_prompt=True)

messages = [
    {"role": "system", "content": "Sei un assistente utile."},
    {"role": "user", "content": "{prompt}"}
]

with torch.no_grad():
    temp = tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)
    inputs = tokenizer(temp, return_tensors="pt").to("cuda")

    _ = model.generate(
        **inputs,
        streamer=streamer,
        generation_config=gen
    )

高级用法

生成Mermaid思维导图

messages = [
  {"role": "system", "content": "Fornisci una mindmap Mermaid sull'argomento in input."},
  {"role": "user", "content": "Argomento: [argomento]"}
]

生成SQL查询语句

schema = "[db schema]"
messages = [
  {"role": "system", "content": f"Sei un assistente SQL e il tuo compito è convertire la domanda dell'utente in codice SQL valido rispetto allo schema del database fornito.\n\nSchema:\n```sql\n{schema}\n```"},
  {"role": "user", "content": "Conta il numero di X prodotti dall'azienda Y"}
]

根据标题和索引生成文章

messages = [
  {"role": "system", "content": "Sei un assistente utile."},
  {"role": "user", "content": (
    "Scrivi un articolo a partire dal titolo e dall'indice dei contenuti.\n\n"
    "Titolo: [titolo]\n\n"
    "Indice:\n\n"
    "1. Introduzione\n"
    "2. [heading]\n"
    "..."
  )}
]

📚 详细文档

模型得分

任务	版本	过滤器	n-shot	指标	值		标准误差
hellaswag_it	1	none	0	acc	0.5270	±	0.0052
		none	0	acc_norm	0.7037	±	0.0048
arc_it	1	none	0	acc	0.1771	±	0.0112
		none	0	acc_norm	0.5218	±	0.0146
m_mmlu_it	0	none	5	acc	0.5623	±	0.0043