随着《个人信息保护法》的正式实施,监管部门针对企业个人信息保护的合规要求也越来越明确,包括要求企业遵循个人信息处理的原则和规则,针对个人信息的收集、存储、传输、使用、共享、销毁等保护要求和操作规范方面做出专门规定。针对企业内部个人信息管理使用和管理方面,很多监管机构要求企业的业务系统前端界面上展示个人信息时需要对个人隐私信息进行脱敏/遮蔽处理,企业需要采取技术手段满足合规要求。
数据脱敏是什么?
数据脱敏顾名思义就是对敏感数据进行变形处理,其目的是保护隐私数据等信息的安全,例如机构和企业收集的个人身份信息、手机号码、银行卡信息等敏感数据。数据脱敏从技术上可以分为静态数据脱敏和动态数据脱敏两种。静态数据脱敏一般应用于数据外发场景,例如需要将生产数据导出发送给开发人员、测试人员、分析人员等;动态脱敏一般应用于直接连接生产数据的场景,例如运维人员在运维的工作中直接连接生产数据库进行运维,客服人员通过应用直接调取生产中的个人信息等。
静态脱敏与动态脱敏主要的区别在于:
静态脱敏适用于将数据抽取出生产环境脱敏后分发至测试、开发、培训、数据分析等场景。
原理是将数据抽取进行脱敏处理后,下发至脱敏库。开发、测试、培训、分析人员可以随意取用脱敏数据,并进行读写操作,脱敏后的数据与生产环境隔离,满足业务需要的同时保障生产数据的安全,静态脱敏可以概括为数据的“搬移并仿真替换”。
动态脱敏适用于不脱离生产环境,对敏感数据的查询和调用结果进行实时脱敏。
原理是将生产库返回的数据进行实时脱敏处理,例如应用需要呈现部分数据,但是又不希望应用账号可以看到全部数据;运维人员需要维护数据,但又不希望运维人员可以检索或导出真实数据,动态脱敏可以概括为“边脱敏,边使用”。
目前数据脱敏存在的痛点需求:
1.业务系统技术改造成本高昂
对旧有业务系统进行升级技术改造,是最为彻底的安全合规手段,然而代码改造的成本较高,并且很多遗留应用系统的开发商已经无法提供代码改造技术支持,采购的商业软件也无法进行改造。此外,伴随监管合规要求的变化,业务系统可能需要多次改造,合规成本过高。
2.担心引入单点故障影响业务
通过部署传统的数据动态脱敏产品可以免除业务改造难题,但是现有产品往往是硬件设备或者单体软件,串接部署在业务应用系统和数据库之间,一旦出现软硬件单点故障,将会影响业务的连续性。即使采用了”双机热备“之类的冗余机制,安全运维团队也很难打消业务部门的顾虑。
3.多场景脱敏策略统一管理难
企业的研发运维工具、业务应用前端、数据分析应用、API 数据共享等等,这些数据使用环节都有动态脱敏需求,但是执行数据动态脱敏的位置不同、技术不同、工具不同,给动态脱敏策略的统一管理造成困难,增加了管理和运营的成本。
4.性能成本难以兼顾
此外,数字化业务迭代快速,数据量和 API 不断增长,如遇上突发业务波峰,传统动态脱敏方案,固定投入的硬件设备或单体软件架构存在性能瓶颈,“备足冗余”和“高效稳定”总是难以兼得。
5.脱敏数据影响业务
有些业务应用系统在架构设计上存在这样的场景,例如:业务应用前端展示需要某个数据脱敏,但同时又需要对该数据进行编辑,或者使用该数据进行关联查询,而脱敏后的数据是不可逆的,就会造成无法编辑或查询失败,影响业务的正常进行。
所以我们可以来看看数据脱敏的实现方式有哪些,可以根据自身情况来做选择。
一、使用脚本进行脱敏
事实上,很多用户在信息化发展的早期,就已经意识到了数据外发带来的敏感数据泄露的风险,那时候用户往往通过手动方式直接写一些代码或者脚本来实现数据的脱敏变形,比如:简单的将敏感人的姓名、身份证号等信息替换为另一个人的,或者将一段地址随机变为另一个地址。
列如:
!/bin/bash
cat ./id.txt|while read a b #a和b分别代表姓名列和身份证列
do
name1=echo ${a:1:1}
name=echo ${a//$name1/X}
id1=echo ${b:6:8}
id=echo ${b//$id1/XXXXXXXX}
echo $name $id
done
二、使用专业的数据脱敏产品进行脱敏
近年来,随着各行业信息化管理制度的逐步完善、数据使用场景愈加复杂、脱敏后数据仿真度要求逐渐提升,为保证脱敏果准确而高效,专业化的数据脱敏产品逐渐成为了用户的普遍选择。相比传统的手工脱敏方法,专业的脱敏产品除了保证脱敏效果可达,更重要的价值点在于提高脱敏效率,在不给用户带来过多额外工作量的同时,最大程度节省用户操作时间。
一个好的数据脱敏产品应具有以下这几个特点:
1.丰富的脱敏算法
支持固定映射、随机映射、遮蔽、数据字典、格式保留、截断、偏移、同态加密、置空、差分隐私、散列、加密等算法。
2.合规的审批制度
静态脱敏支持在脱敏前先发起脱敏方案的审批,审批通过后才能进行脱敏。动态脱敏支持对SQL关键字或SQL语句进行操作前的审批。
3.广泛的场景覆盖
动态脱敏既支持数据库脱敏也支持应用脱敏和API脱敏。数字水印既支持页面水印,又支持数据库水印和文件水印。脱敏风险评估既能检查数据是否进行了脱敏或加密,又能对已脱敏数据的重识别风险进行评估。
4.灵活的脱敏方式
既支持对敏感数据发现的结果直接进行敏感类型的脱敏也支持对指定字段进行脱敏。
5.海量的API
产品内置数百个API,方便与第三方数管平台的对接。
三、数据脱敏技术
数据脱敏的基本原理是通过脱敏算法将敏感数据进行遮蔽、变形,将敏感级别降低后对外发放,或供访问使用。可采用以下这几个方式:
1.实时更新的敏感数据目录
通过自动化的数据访问流量解析技术、敏感数据智能识别技术、数据分类分级自动化标注技术,帮助企业建立起敏感数据资产目录,并有的放矢地配置实施灵活的敏感数据动态脱敏策略。
2.分布式架构实现故障隔离
分布式架构设计,管理平面与控制平面分离。管理平面承载脱敏策略编排管理和数据安全风险分析的集中管理和运营,提高管理运营效率,有效隔离单点故障,保障业务连续性。
无论是静态脱敏还是动态脱敏其最终都是为了防止组织内部对隐私数据的滥用,防止隐私数据在未经脱敏的情况下从组织流出。满足组织既要保护隐私数据,同时又保持监管合规,满足合规性。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。