Meditron3 - 8B开源临床医学大语言模型，助力资源匮乏地区医疗应用

首页

Meditron3 8B

由 OpenMeditron 开发

专注于临床医学的大语言模型，特别关注资源匮乏地区和人道主义环境

大型语言模型

Transformers

英语#医学循证指南 #人道主义医疗 #临床决策支持

下载量 1,282

发布时间 : 7/11/2024

模型简介

基于Llama-3.1[8B]基础模型训练，旨在提升临床决策与循证医学信息获取能力

模型特点

医学专业领域

专注于临床医学，特别关注资源匮乏地区和人道主义环境

多样化训练数据

融合临床指南、医学期刊、合成诊断数据等多源医学数据

循证医学导向

强调可操作的现实世界循证指南

公平代表性

训练数据注重情境多样性和公平代表性

模型能力

医学文本生成

临床问答

医学信息检索

鉴别诊断辅助

使用案例

医学研究

临床指南检索

快速获取权威临床实践指南信息

医学文献分析

辅助理解医学期刊文献内容

医学教育

医学知识问答

回答医学相关选择题和理论问题

🚀 模型卡片：Llama-3.1 Meditron-3[8B]

Meditron是一套专门用于临床医学的大语言模型。这些模型是与众多临床专家和人道主义从业者共同设计的。其训练过程强调公平的代表性、上下文的多样性以及基于实际证据的可行指导方针。我们特别注重呈现资源有限地区和人道主义环境、被忽视的人群和疾病。此版本基于Llama-3.1[8B]基础模型进行训练，命名为Llama-3.1 Meditron-3[8B]。

📚 详细文档

模型详情

属性	详情
开发方	OpenMeditron倡议组织
模型类型	仅因果解码器的Transformer语言模型
语言	主要为英语
微调基础模型	Llama-3.1-8B
输入	仅文本
输出	仅文本
状态	这是一个基于离线数据集训练的静态模型。随着我们对模型性能的提升，未来将发布调优后模型的新版本。

用途

直接使用

Meditron-3是仅用于研究的模型，未经过医学用途验证（见下方免责声明）。

下游应用

Meditron-3是一套尚未进行微调或指令调优的基础模型。不过，这些模型可以使用诸如基于人类反馈的强化学习（RLHF）或直接偏好优化（DPO）等技术，适配特定的下游任务或应用。在我们对模型的评估中，针对下游问答任务使用了两种不同的方法：

在提示中添加k个示例进行上下文学习。
使用特定训练数据集对模型进行问答任务的微调。

训练数据

这种新的数据混合体包含了专家整理的公开可用数据，并结合了多个来源：

临床指南：来自世界各地各种医疗相关机构（包括医院和国际组织）的国际公认临床实践指南数据集。
同行评审的医学出版物：医学全文文章。
合成鉴别诊断：用于鉴别诊断的类似合成对话的数据。
回放数据：从多个最先进的预训练和指令调优中采样的通用领域预训练数据。
大语言模型增强的医学多项选择题：由大语言模型增强的医学多项选择题。

关于数据集的更多信息将包含在Meditron-3的出版物中。

评估

Llama[3.1]-Meditron-3[8B]的评估结果即将公布！

我们使用lm-harness对Meditron进行医学多项选择题评估，以确保可重复性。虽然多项选择题对于评估类似考试的表现很有价值，但它们无法全面体现模型在现实世界中的实用性，特别是在资源匮乏环境中的上下文适应能力。医学并非简单的多项选择题，我们需要超越准确性，评估更细粒度的问题，如同理心、与当地指南的一致性、结构、完整性和安全性。为了解决这个问题，我们开发了一个平台，直接收集专家的反馈，以不断适应临床实践不断变化的环境。