敏感日志脱敏

日志是故障排查的第一手资料，但日志中往往包含大量敏感信息：用户个人信息、身份证号、信用卡号、密码密钥、API 密钥等。如果日志直接存储或外发，不仅违反数据合规要求（如 GDPR、个人信息保护法），还可能造成严重的安全事故。日志脱敏是将敏感信息转换为不可逆的匿名标识符，在保护隐私的同时保留日志的可分析价值。

脱敏不是简单的「删除敏感字段」，而是需要在安全性和可用性之间取得平衡。例如，将用户姓名完全替换为「***」，日志就失去了「按用户维度分析」的能力；正确的做法是保留脱敏后的标识符（如 user_id 的哈希值），让同一用户在多条日志中可关联，但不暴露真实姓名。

常见脱敏规则

敏感类型	示例	脱敏方式	保留能力
手机号	13812345678	138****5678	批次区分
身份证号	110101199001011234	110101****01234	出生年月前缀
信用卡号	6222021234567890	****7890	卡种+尾号
邮箱	user@example.com	u***@example.com	域名分析
密码/密钥	p@ssw0rd	REDACTED	无
地址	北京市朝阳区xxx	北京市**区	地区分析

实施策略

日志脱敏的实施分为三个层面：写入时脱敏在日志产生时就进行处理，性能开销低但无法覆盖所有场景；采集时脱敏在 Logstash/Fluentd 等采集器中配置脱敏规则，对现有代码无侵入；查询时脱敏在日志系统（如 Elasticsearch）层配置访问控制和数据屏蔽。

生产实践中，推荐多层防护策略：代码层使用脱敏工具类处理敏感字段，采集层配置正则规则兜底，存储层配置字段级访问控制。这样即使某一层被绕过，其他层仍能提供保护。

#敏感日志脱敏

#常见脱敏规则

#实施策略

敏感日志脱敏

常见脱敏规则

实施策略