D

Distilbert Finetuned Ai4privacy V2

由 Isotonic 开发
基于distilbert-base-uncased微调的PII(个人身份信息)识别模型,用于从文本中检测和移除敏感信息
下载量 3,499
发布时间 : 11/20/2023
模型介绍
内容详情
替代品

模型简介

该模型在全球最大的开源隐私数据集上微调,能够识别54类敏感信息,适用于AI助手和LLM场景下的隐私保护

模型特点

广泛的PII识别能力
支持识别54种敏感数据类型,包括金融信息、身份标识、联系方式等
高效轻量级模型
基于DistilBERT架构,在保持高准确率的同时减少计算资源需求
多场景适用性
训练数据涵盖229个讨论主题和5种交互风格,适用于多种文本场景

模型能力

文本中的敏感信息检测
个人身份信息识别
隐私数据分类
多类别实体识别

使用案例

隐私保护
AI聊天记录脱敏
自动识别并屏蔽聊天记录中的敏感信息
F1分数达0.9549
文档隐私审查
扫描文档中的个人身份信息以符合GDPR等隐私法规
电子邮件识别F1分数1.0
数据安全
日志匿名化处理
自动移除系统日志中的敏感数据
IP地址识别F1分数0.4349