P

Piiranha

由 scampion 开发
基于ModernBERT-base微调的标记分类模型,专门用于识别和分类文本中的个人身份信息(PII)
下载量 79
发布时间 : 1/29/2025
模型介绍
内容详情
替代品

模型简介

该模型在ai4privacy/pii-masking-400k数据集上训练,可检测17种PII类别,适用于隐私保护应用场景如数据匿名化、信息脱敏或数据保护法规合规。

模型特点

多类别PII检测
能够识别17种不同类型的个人身份信息(PII)类别
高精度识别
在验证集上达到92.1%的精确率和92.7%的召回率
隐私保护优化
专门针对隐私保护场景优化,适用于数据匿名化和脱敏处理

模型能力

文本中的个人身份信息识别
隐私数据分类
敏感信息检测

使用案例

数据隐私保护
数据匿名化处理
自动识别并标记数据集中的个人身份信息以便匿名化处理
F1值达到0.924
合规性检查
帮助企业检查数据是否符合GDPR等隐私保护法规要求