InternLm-ChatBode-7b开源语言模型 - 专用于葡萄牙语对话交流优化

首页

Internlm Chatbode 7b

由 recogna-nlp 开发

InternLm-ChatBode 是一个针对葡萄牙语进行微调的语言模型，基于 InternLM2 开发，通过 UltraAlpaca 数据集优化。

大型语言模型

Transformers

其他#葡萄牙语优化 #QLoRA微调 #教育问答

下载量 128

发布时间 : 5/7/2024

模型简介

该模型是针对葡萄牙语优化的对话模型，适用于葡萄牙语文本生成和问答任务。

模型特点

葡萄牙语优化

专门针对葡萄牙语进行微调，提升葡萄牙语文本生成质量。

基于 InternLM2

以强大的 InternLM2 为基础模型，具备优秀的语言理解和生成能力。

QLoRA 微调

使用 QLoRA 技术进行高效微调，平衡性能与资源消耗。

模型能力

葡萄牙语文本生成

葡萄牙语问答

流式文本生成

使用案例

教育

数学概念解释

解释数学定理如勾股定理并提供示例

能够准确解释概念并提供相关示例

客户服务

葡萄牙语客服机器人

用于处理葡萄牙语客户的咨询

能够理解并生成自然的葡萄牙语回复

🚀 internlm-chatbode-7b

InternLm-ChatBode 是一个针对葡萄牙语进行微调的语言模型，它基于 InternLM2 模型开发。该模型通过使用 UltraAlpaca 数据集进行微调得到进一步优化。

ChatBode Logo

✨ 主要特性

基础模型：internlm/internlm2-chat-7b
微调数据集：UltraAlpaca
训练方式：使用 QLoRA 对 internlm2-chat-7b 进行微调训练。

💻 使用示例

基础用法

import torch
from transformers import AutoTokenizer, AutoModelForCausalLM
tokenizer = AutoTokenizer.from_pretrained("recogna-nlp/internlm-chatbode-7b", trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained("recogna-nlp/internlm-chatbode-7b", torch_dtype=torch.float16, trust_remote_code=True).cuda()
model = model.eval()
response, history = model.chat(tokenizer, "Olá", history=[])
print(response)
response, history = model.chat(tokenizer, "O que é o Teorema de Pitágoras? Me dê um exemplo", history=history)
print(response)

高级用法

可以使用 stream_chat 方法以流式方式生成回复：

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer

model_path = "recogna-nlp/internlm-chatbode-7b"
model = AutoModelForCausalLM.from_pretrained(model_path, torch_dtype=torch.float16, trust_remote_code=True).cuda()
tokenizer = AutoTokenizer.from_pretrained(model_path, trust_remote_code=True)

model = model.eval()
length = 0
for response, history in model.stream_chat(tokenizer, "Olá", history=[]):
    print(response[length:], flush=True, end="")
    length = len(response)

📚 详细文档

Open Portuguese LLM Leaderboard 评估结果

详细结果可在此处和 Open Portuguese LLM Leaderboard 上查看。

指标	数值
平均值	69.54
ENEM Challenge (No Images)	63.05
BLUEX (No Images)	51.46
OAB Exams	42.32
Assin2 RTE	91.33
Assin2 STS	80.69
FaQuAD NLI	79.80
HateBR Binary	87.99
PT Hate Speech Binary	68.09
tweetSentBR	61.11

📄 引用

如果您想在研究中使用 Chatbode，请按以下方式引用：

@misc {chatbode_2024,
	author       = { Gabriel Lino Garcia, Pedro Henrique Paiola and  and João Paulo Papa},
	title        = { Chatbode },
	year         = {2024},
	url          = { https://huggingface.co/recogna-nlp/internlm-chatbode-7b/ },
	doi          = { 10.57967/hf/3317 },
	publisher    = { Hugging Face }
}