P

Pii Entity Extractor

由 AI-Enthusiast11 开发
基于DeBERTa微调的命名实体识别模型,专门用于检测文本中的个人身份信息(PII),如姓名、社保号码、电话号码等敏感信息。
下载量 155
发布时间 : 4/25/2025
模型介绍
内容详情
替代品

模型简介

该模型通过标记级分类进行序列标注,能准确识别文本中的各类个人身份信息实体,适用于隐私保护和数据脱敏场景。

模型特点

高精度PII检测
在测试数据上F1值达到0.95以上,能准确识别多种PII类型
多类别实体识别
支持姓名、社保号码、电话号码、信用卡号、地址等7类PII检测
子词合并处理
内置后处理逻辑可自动合并被拆分的子词标记

模型能力

文本中的敏感信息检测
命名实体识别
数据脱敏处理
隐私保护

使用案例

隐私保护
文档脱敏
自动识别并替换文档中的敏感信息
实现自动化数据脱敏流程
合规审查
检测文本中可能违反隐私法规的内容
帮助组织满足GDPR等合规要求
数据安全
日志清洗
在存储日志前移除敏感信息
降低数据泄露风险