mental-health-mistral-7b-instructv0.2-finetuned-V2开源模型 - 模拟心理咨询对话助你心理健康

首页

Mental Health Mistral 7b Instructv0.2 Finetuned V2

由 GRMenon 开发

基于Mistral-7B-Instruct-v0.2微调的心理健康对话助手模型，专门用于模拟心理学家与用户的咨询对话。

大型语言模型

Transformers

开源协议:Apache-2.0 #心理咨询对话生成 #心理健康助手 #Mistral-7B微调

下载量 815

发布时间 : 12/29/2023

模型简介

该模型是在心理健康对话语料库上微调的Mistral-7B-Instruct-v0.2模型，旨在创建名为'Connor'的心理健康助手，根据心理学家的回答来解答用户的问题。

模型特点

心理健康专业对话

专门针对心理健康咨询场景优化，能够生成类似心理学家的专业回答

指令微调

基于Mistral-7B-Instruct-v0.2进行微调，优化了指令跟随能力

低资源高效训练

使用PEFT(参数高效微调)技术，在有限资源下实现高质量微调

模型能力

心理健康咨询对话生成

情感支持响应生成

心理咨询建议提供

使用案例

心理健康支持

在线心理咨询助手

作为虚拟心理咨询助手，为用户提供初步的心理健康支持和建议

能够生成类似专业心理学家的响应

心理健康教育

帮助用户了解常见的心理健康问题和应对策略

🚀 mental-health-mistral-7b-instructv0.2-finetuned-V2

本模型是 mistralai/Mistral-7B-Instruct-v0.2 在 mental_health_counseling_conversations 数据集上的微调版本。它在评估集上取得了如下结果：

损失值：0.6432

🚀 快速开始

模型使用示例

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer
from peft import PeftConfig, PeftModel

base_model = "mistralai/Mistral-7B-Instruct-v0.2"
adapter = "GRMenon/mental-health-mistral-7b-instructv0.2-finetuned-V2"

# Load tokenizer
tokenizer = AutoTokenizer.from_pretrained(
    base_model,
    add_bos_token=True,
    trust_remote_code=True,
    padding_side='left'
)

# Create peft model using base_model and finetuned adapter
config = PeftConfig.from_pretrained(adapter)
model = AutoModelForCausalLM.from_pretrained(config.base_model_name_or_path,
                                             load_in_4bit=True,
                                             device_map='auto',
                                             torch_dtype='auto')
model = PeftModel.from_pretrained(model, adapter)

device = "cuda" if torch.cuda.is_available() else "cpu"
model.to(device)
model.eval()

# Prompt content:
messages = [
    {"role": "user", "content": "Hey Connor! I have been feeling a bit down lately.I could really use some advice on how to feel better?"}
]

input_ids = tokenizer.apply_chat_template(conversation=messages,
                                          tokenize=True,
                                          add_generation_prompt=True,
                                          return_tensors='pt').to(device)
output_ids = model.generate(input_ids=input_ids, max_new_tokens=512, do_sample=True, pad_token_id=2)
response = tokenizer.batch_decode(output_ids.detach().cpu().numpy(), skip_special_tokens = True)

# Model response: 
print(response[0])