Mistral-7B-v0.2-meditron-turkish开源模型 - 免费支持土英双语医学信息问答

首页

Mistral 7B V0.2 Meditron Turkish

由 malhajar 开发

基于Mistral模型微调的土耳其语医学领域大语言模型，支持土耳其语和英语的医学信息问答

大型语言模型

Transformers

支持多种语言开源协议:Apache-2.0 #土耳其语医学问答 #多语言医疗模型 #SFT微调

下载量 2,886

发布时间 : 1/5/2024

模型简介

该模型是在Mistral-7B-v0.2基础上使用土耳其语Meditron数据集进行微调的版本，专注于医学领域的文本生成任务，能够回答土耳其语和英语中关于医学概念的问题。

模型特点

医学领域专业化

针对土耳其语医学内容进行专门优化，能够准确回答医学相关问题

双语支持

同时支持土耳其语和英语的问答

高效微调

采用冻结技术和SFT训练方法进行高效微调

模型能力

医学信息问答

土耳其语文本生成

英语文本生成

医学概念解释

使用案例

医疗健康

医学知识问答

回答关于疾病、症状、治疗等医学问题

在医学相关问题上表现良好

医学术语解释

解释复杂的医学术语和概念

能够提供准确的术语解释

教育

医学教育辅助

辅助医学学生学习和理解医学知识

🚀 Mistral-7B-v0.2-meditron-turkish模型

Mistral-7B-v0.2-meditron-turkish是一个经过微调的Mistral模型版本。它运用Freeze技术，在土耳其语的Meditron数据集malhajar/meditron-7b-tr上进行了SFT训练。该模型能够用土耳其语和英语回答医学领域不同明确概念的相关信息。

🚀 快速开始

使用原帖中提供的代码示例与模型进行交互。

from transformers import AutoTokenizer,AutoModelForCausalLM
 
model_id = "malhajar/Mistral-7B-v0.2-meditron-turkish"
model = AutoModelForCausalLM.from_pretrained(model_name_or_path,
                                             device_map="auto",
                                             torch_dtype=torch.float16,
                                             revision="main")

tokenizer = AutoTokenizer.from_pretrained(model_id)

question: "Akciğer kanseri nedir?"
# For generating a response
prompt = '''
### Kullancı:
{question} 
'''
input_ids = tokenizer(prompt, return_tensors="pt").input_ids
output = model.generate(inputs=input_ids,max_new_tokens=512,pad_token_id=tokenizer.eos_token_id,top_k=50, do_sample=True,
        top_p=0.95)
response = tokenizer.decode(output[0])

print(response)

✨ 主要特性

多语言支持：支持土耳其语和英语，可在这两种语言下回答医学相关信息。
微调优化：基于Mistral模型，在土耳其语Meditron数据集上进行微调，提升了在医学领域的回答能力。

📚 详细文档

模型描述

微调者：Mohamad Alhajar
语言（NLP）：土耳其语、英语
微调基础模型：mistralai/Mistral-7B-Instruct-v0.2

提示模板

土耳其语生成提示模板

### Kullancı:

英语生成提示模板

### User:

📄 许可证

本模型使用Apache-2.0许可证。

📈 Open LLM Leaderboard评估结果

详细结果可查看此处

指标	值
平均值	63.34
AI2推理挑战（25次少样本学习）	59.56
HellaSwag（10次少样本学习）	81.79
MMLU（5次少样本学习）	60.35
TruthfulQA（0次少样本学习）	66.19
Winogrande（5次少样本学习）	76.24
GSM8k（5次少样本学习）	35.94