L

Llama2 7b WhoIsHarryPotter

由 microsoft 开发
该模型通过微调技术实现了从大型语言模型中选择性遗忘《哈利·波特》系列知识的能力,同时保持其他性能不变。
下载量 520
发布时间 : 10/3/2023
模型介绍
内容详情
替代品

模型简介

本模型是大型语言模型遗忘技术的概念验证,无需重新训练即可从LLM中擦除特定训练数据(《哈利·波特》系列内容),在标准基准测试中表现与原始模型基本一致。

模型特点

选择性知识遗忘
无需重新训练即可从模型中擦除特定领域知识(《哈利·波特》系列)
性能保持
在标准基准测试中表现与原始模型基本一致,仅目标知识被擦除
高效微调
仅需0.5小时训练时间(4块A100 GPU)和400万词元即可完成知识擦除

模型能力

文本生成
知识选择性遗忘
对话系统

使用案例

研究应用
遗忘技术研究
用于测试和验证大型语言模型的知识遗忘技术
成功擦除《哈利·波特》系列相关知识的95%以上
模型安全研究
研究如何从模型中移除敏感或不适当的内容