Caramelinho开源双语文本生成模型 - 免费部署实现葡语英语文本创作

首页

Caramelinho

由 Bruno 开发

基于Falcon-7B模型通过QLoRA方法微调的双语(葡萄牙语/英语)文本生成模型

大型语言模型支持多种语言#葡萄牙语指令微调 #QLoRA高效微调 #Falcon-7B基础

下载量 22

发布时间 : 6/9/2023

模型简介

该适配器使用金丝雀指令数据集对Falcon-7B进行微调，支持葡萄牙语和英语的文本生成任务

模型特点

双语支持

专门针对葡萄牙语和英语优化，适合双语文本生成场景

高效微调

采用QLoRA参数高效微调方法，在保持原模型性能的同时减少计算资源需求

指令跟随

经过指令数据集微调，能够更好地理解和执行用户指令

模型能力

文本生成

指令响应

多轮对话

内容创作

使用案例

教育

语言学习助手

帮助葡萄牙语学习者进行双语练习和解释

可生成准确的语法解释和翻译示例

内容创作

双语内容生成

自动生成葡萄牙语和英语的营销文案或社交媒体内容

可保持品牌声音一致性的同时提高内容产出效率

🚀 焦糖模型（Caramelinho）

本项目的焦糖模型（Caramelinho）是基于特定方法对基础模型进行微调得到的文本生成模型，可用于多种文本生成任务。

🚀 快速开始

模型信息

属性	详情
数据集	dominguesm/Canarim-Instruct-PTBR-Dataset
库名称	adapter-transformers
任务类型	文本生成
支持语言	葡萄牙语、英语
缩略图	点击查看

模型描述

此适配器使用 PEFT 库创建，通过 QLoRA 方法，允许在 Canarim 数据集上对基础模型 Falcon - 7b 进行微调。基础模型为 Falcon 7B。

使用示例

基础用法

import torch
from peft import PeftModel, PeftConfig
from transformers import AutoModelForCausalLM, AutoTokenizer, BitsAndBytesConfig, GenerationConfig

peft_model_id = "Bruno/Caramelinho"

config = PeftConfig.from_pretrained(peft_model_id)
bnb_config = BitsAndBytesConfig(
    load_in_4bit=True,
    bnb_4bit_quant_type="nf4",
    bnb_4bit_compute_dtype=torch.float16,
)

tokenizer = AutoTokenizer.from_pretrained(peft_model_id)

model = AutoModelForCausalLM.from_pretrained(config.base_model_name_or_path,
                                             return_dict=True,
                                             quantization_config=bnb_config, 
                                             trust_remote_code=True, 
                                             device_map={"": 0})
prompt_input = "Abaixo está uma declaração que descreve uma tarefa, juntamente com uma entrada que fornece mais contexto. Escreva uma resposta que conclua corretamente a solicitação.\n\n ### Instrução:\n{instruction}\n\n### Entrada:\n{input}\n\n### Resposta:\n"
prompt_no_input = "Abaixo está uma instrução que descreve uma tarefa. Escreva uma resposta que conclua corretamente a solicitação.\n\n### Instrução:\n{instruction}\n\n### Resposta:\n"

def create_prompt(instruction, input=None):
    if input:
        return prompt_input.format(instruction=instruction, input=input)
    else:
        return prompt_no_input.format(instruction=instruction)

def generate(
        instruction,
        input=None,
        max_new_tokens=128,
        temperature=0.1,
        top_p=0.75,
        top_k=40,
        num_beams=4,
        repetition_penalty=1.7,
        max_length=512
):
    prompt = create_prompt(instruction, input)
    inputs = tokenizer.encode_plus(prompt, return_tensors="pt", truncation=True, max_length=max_length, padding="longest")
    input_ids = inputs["input_ids"].to("cuda")
    attention_mask = inputs["attention_mask"].to("cuda")

    generation_output = model.generate(
        input_ids=input_ids,
        attention_mask=attention_mask,
        max_length=max_length,
        pad_token_id=tokenizer.pad_token_id,
        eos_token_id=tokenizer.eos_token_id,
        temperature=temperature,
        top_p=top_p,
        top_k=top_k,
        num_beams=num_beams,
        repetition_penalty=repetition_penalty,
        length_penalty=0.8,
        early_stopping=True,
        output_scores=True,
        return_dict_in_generate=True
    )

    output = tokenizer.decode(generation_output.sequences[0], skip_special_tokens=True)
    return output.split("### Resposta:")[1]

instruction = "Descrever como funcionam os computadores quânticos."
print("Instrução:", instruction)
print("Resposta:", generate(instruction))

输出示例

Instrução: Descrever como funcionam os computadores quânticos.
Resposta: 
Os computadores quânticos são um tipo de computador cuja arquitetura é baseada na mecânica quântica. Os computadores quânticos são capazes de realizar operações matemáticas complexas em um curto espaço de tempo.