← AI 百科

数据脱敏

AI基础 · 数据安全
一句话:在把资料交给AI或外部工具前,先隐藏手机号、姓名、地址、订单号等敏感信息。

它是什么

数据脱敏是把真实敏感信息替换成假值、占位符或模糊内容,让别人或AI能理解业务结构,但看不到真实隐私。比如把手机号替换成{手机号A},把客户姓名替换成{客户1}。它是小团队使用AI处理客户资料、合同、工单时最基础的安全动作。

适合干什么

  • 需要把客户资料发给AI分析的人
  • 处理合同、订单、工单、面试资料的团队
  • 做客服总结和销售复盘的人
  • 担心隐私泄露的小公司

不适合干什么

  • 必须保留真实身份才能处理的正式业务
  • 没有权限处理这些资料的人
  • 需要合规审计但没有制度支持的流程
  • 认为脱敏后就可以随便公开的人

普通人怎么用

  • 先识别姓名、电话、地址、邮箱、身份证、订单号
  • 用统一占位符替换真实信息
  • 保留字段关系,比如客户A对应订单A
  • 再把脱敏后的内容发给AI
  • 结果回填时由人工对应真实数据

进阶用户怎么用

  • 建立常用敏感字段清单
  • 用脚本批量脱敏表格和文本
  • 按风险级别选择删除、替换或泛化
  • 记录哪些资料允许进入外部AI工具

常见误区

  • 只删除姓名,忘了电话和地址也能识别身份
  • 脱敏后字段关系混乱,AI无法分析
  • 把真实截图直接上传
  • 把脱敏资料发到公开链接

和相似工具的区别

  • 数据脱敏 vs 数据删除:脱敏保留业务结构,删除则直接去掉内容。
  • 数据脱敏 vs 权限控制:脱敏减少内容敏感度,权限控制决定谁能看资料。

入门步骤

  • 复制一份待处理资料
  • 标出敏感字段
  • 替换成占位符
  • 检查是否还能反推出身份
  • 交给AI处理
  • 人工回填真实业务信息

推荐工具(第三方)

Excel、Google Sheets、Python、正则表达式、DLP工具