Llama-3-portuguese-Tom-cat-8b-instruct开源对话模型

首页

Llama 3 Portuguese Tom Cat 8b Instruct

由 rhaymison 开发

基于Llama3 8B微调的葡萄牙语对话模型，填补了葡萄牙语模型的空白，优化了对话能力

大型语言模型

Transformers

其他开源协议:Apache-2.0 #葡萄牙语对话 #指令微调 #小模型优化

下载量 54

发布时间 : 4/30/2024

模型简介

该模型基于30万条葡萄牙语对话数据进行训练，旨在提供高质量的葡萄牙语对话体验。基于Meta的Llama3 8B模型进行微调，主要优化了葡萄牙语理解和生成能力。

模型特点

葡萄牙语优化

专门针对葡萄牙语进行微调，提供更自然的葡萄牙语理解和生成能力

指令跟随

能够很好地理解和执行用户指令，适合构建对话系统

多量化版本支持

提供从完整模型到4位量化的多种版本，适应不同硬件需求

模型能力

葡萄牙语文本生成

对话系统构建

问答系统

指令跟随

使用案例

教育

数学解释

可以扮演数学老师解释基础数学概念

能清晰解释2+2=4等基础数学问题

考试辅助

帮助准备ENEM等葡萄牙语考试

在ENEM挑战赛测试中达到70.4%准确率

专业服务

法律咨询

解释巴西律师公会(OAB)相关信息

能准确描述巴西律师公会的职能和结构

情感分析

仇恨言论检测

识别葡萄牙语中的仇恨言论

在HateBR测试中达到86.99宏观F1值

🚀 Llama-3-portuguese-Tom-cat-8b-instruct

该模型基于30万个葡萄牙语聊天记录的超集进行训练，旨在填补葡萄牙语模型的空白。它在Llama3 8B的基础上进行微调，主要适用于聊天场景。

如果你正在寻找兼容性更强的模型，Luana模型还有可以与LlamaCpp一起运行的GGUF系列。你可以从以下模型开始探索GGUF模型：

Llama-3-portuguese-Tom-cat-8b-instruct-q8-gguf

探索这个和其他模型，找到最适合你需求的模型！

🚀 快速开始

完整模型：A100

半精度模型：L4

8位或4位量化：T4或V100

你可以以正常形式使用该模型，也可以进行4位量化。下面我们将介绍这两种方法。请记住，在提示词中使用合适的动词很重要。告诉模型如何行动或表现，这样你就能引导它们给出合适的回复。像这样的要点可以帮助模型（即使是像8B这样的小模型）表现得更好。

!pip install -q -U transformers
!pip install -q -U accelerate
!pip install -q -U bitsandbytes

from transformers import AutoModelForCausalLM, AutoTokenizer, TextStreamer
model = AutoModelForCausalLM.from_pretrained("rhaymison/Llama-3-portuguese-Tom-cat-8b-instruct", device_map= {"": 0})
tokenizer = AutoTokenizer.from_pretrained("rhaymison/Llama-3-portuguese-Tom-cat-8b-instruct")
model.eval()

你可以使用Pipeline来使用该模型。

from transformers import pipeline
pipe = pipeline("text-generation",
                model=model,
                tokenizer=tokenizer,
                do_sample=True,
                max_new_tokens=512,
                num_beams=2,
                temperature=0.3,
                top_k=50,
                top_p=0.95,
                early_stopping=True,
                pad_token_id=tokenizer.eos_token_id,
                )


def format_prompt(question:str):
    system_prompt = "Abaixo está uma instrução que descreve uma tarefa, juntamente com uma entrada que fornece mais contexto. Escreva uma resposta que complete adequadamente o pedido."

    return f"""<|begin_of_text|><|start_header_id|>system<|end_header_id|>
    { system_prompt }<|eot_id|><|start_header_id|>user<|end_header_id|>
    { question }<|eot_id|><|start_header_id|>assistant<|end_header_id|>"""

prompt =  format_prompt("Me fale sobra a OAB, Ordem dos Advogados do Brasil")
result = pipe(prompt)
result[0]["generated_text"].split("assistant<|end_header_id|>")[1]

#A Ordem dos Advogados do Brasil (OAB) é a entidade responsável por regulamentar e fiscalizar a profissão de advogado no Brasil.
#Foi criada em 1930, com o objetivo de proteger os direitos e interesses dos advogados e da sociedade, garantindo a defesa dos direitos e garantias fundamentais.
#A OAB é uma entidade de direito público, com personalidade jurídica própria, e é composta por advogados e advogadas que atuam em todo o território nacional.
#A entidade é dirigida por um Conselho Federal, que é o órgão máximo da OAB, e é composto por 32 membros, eleitos por votação direta dos advogados e advogadas.
#A OAB tem como principais atribuições:. Regulamentar a profissão de advogado: a OAB estabelece as normas e regulamentações para a formação, habilitação e exercício 
#a profissão de advogado no Brasil. Fiscalizar a atividade dos advogados: a OAB fiscaliza a atividade dos advogados, verificando se eles atendem às normas e
#regulamentações estabelecidas.. Defender os direitos e interesses dos advogados: a OAB defende os direitos e interesses dos advogados, garantindo que eles
#possam exercer sua profissão com liberdade e segurança.\n4. Representar a sociedade: a OAB representa a sociedade, defendendo os direitos e interesses dos 
#dadãos e das instituições.A OAB também é responsável por: Certificar a formação e habilitação dos advogados; Fiscalizar a atividade dos advogados, verificando
#se eles atendem às normas e regulamentações estabelecidas;\n* Defender os direitos e interesses dos advogados, garantindo que eles possam exercer sua profissão
#com liberdade e segurança; Representar a sociedade, defendendo os direitos e interesses dos cidadãos e das instituições.Além disso, a OAB também é responsável por:
#Publicar o Diário da Ordem dos Advogados do Brasil

prompt =  format_prompt("Haja como um professor de matemática e me explique porque 2 + 2 = 4")
result = pipe(prompt)
result[0]["generated_text"].split("assistant<|end_header_id|>")[1]

#Meu aluno, é um prazer explicar um conceito fundamental da matemática!  equação 2 + 2 = 4 pode parecer simples, mas é
#importante entender por quê ela é verdadeira. Em matemática, a adição é uma operação que combina dois números para obter um resultado.
#Nesse caso, estamos adicionando 2 e 2. Para entender melhor, vamos começar com um exemplo concreto. Imagine que você tem 2 maçãs em uma mesa e seu amigo também tem
#2 maçãs em outra mesa. Se você e seu amigo combinam suas maçãs, você terá agora 4 maçãs.Agora, vamos usar símbolos para representar essa situação.
#Podemos escrever 2 + 2 =?, e o resultado é 4. Isso significa que quando você soma 2 e 2, o resultado é 4. Mas por quê isso é verdade? Isso é porque a adição é
#uma operação que segue certas regras. Uma dessas regras é que a ordem em que você soma os números não muda o resultado. Isso significa que 2 + 2 é igual a 2 + 2,
#independentemente da ordem em que você soma.Além disso, a adição também é uma operação que é associativa, o que significa que você pode adicionar números em
#qualquer ordem e o resultado será o mesmo. Por exemplo, (2 + 2) + 0 = 2 + (2 + 0). Isso é verdade porque a adição é uma operação que é idempotente, o que significa
#que adicionando 0 a um número não muda o resultado.Portanto, quando você soma 2 e 2, o resultado é 4 porque a adição segue essas regras. A equação 2 + 2 = 4
#é verdadeira porque é uma consequência lógica da definição da adição e das regras que a governam.Espero que isso tenha ajudado a entender melhor por quê 2 + 2 = 4,
#meu aluno!

如果你遇到“CUDA Out of memory”等内存问题，你应该使用4位或8位量化。在Colab中使用完整模型需要A100。如果你想使用4位或8位量化，T4或L4就可以解决问题。

💻 使用示例

4位量化示例

from transformers import BitsAndBytesConfig
import torch
nb_4bit_config = BitsAndBytesConfig(
    load_in_4bit=True,
    bnb_4bit_quant_type="nf4",
    bnb_4bit_compute_dtype=torch.bfloat16,
    bnb_4bit_use_double_quant=True
)

model = AutoModelForCausalLM.from_pretrained(
    base_model,
    quantization_config=bnb_config,
    device_map={"": 0}
)

📚 详细文档

开放葡萄牙语大语言模型排行榜评估结果

详细结果可在此处和🚀 开放葡萄牙语大语言模型排行榜上查看。

指标	数值
平均值	70.57
ENEM挑战（无图像）	70.40
BLUEX（无图像）	58
OAB考试	51.07
Assin2 RTE	90.91
Assin2 STS	75.40
FaQuAD NLI	76.05
HateBR Binary	86.99
葡萄牙语仇恨言论二分类	60.39
tweetSentBR	65.92