D

Distilbert Base Multilingual Cased Pii

由 yonigo 开发
基于distilbert-base-multilingual-cased微调的多语言PII识别模型,用于识别文本中的个人身份信息。
下载量 531
发布时间 : 6/25/2024
模型介绍
内容详情
替代品

模型简介

该模型在ai4privacy/pii-masking-300k数据集上微调,专门用于识别和分类文本中的个人身份信息(PII),如姓名、地址、电话号码等。

模型特点

多语言支持
基于多语言DistilBERT模型,支持多种语言的PII识别。
高精度识别
在多个PII类别上表现出高F1值,如Email F1达到0.9833,Ip F1达到0.9842。
轻量级模型
基于DistilBERT架构,相比完整BERT模型更轻量,同时保持较高性能。

模型能力

识别个人身份信息
多语言文本处理
实体分类

使用案例

数据隐私保护
自动PII掩码
自动识别文本中的个人身份信息并进行掩码处理,保护用户隐私。
可准确识别姓名、电话号码、地址等多种PII类型
合规性检查
文档合规性审查
检查文档中是否包含需要保护的敏感信息,确保符合隐私法规要求。
高准确率识别多种PII类型,帮助确保合规