我需要使用真实客户信息(姓名、地址、电话号码等)获取生产数据并将其移动到开发环境中,但我想删除任何 真实 客户信息的表象。
这个问题 的一些答案可以帮助我生成新的测试数据,但是如何替换生产数据中的这些列,但保留其他相关列?
假设我有一张包含 10000 个假名的表。我应该使用 SQL 更新进行交叉联接吗?或者做类似的事情
UPDATE table
SET lastname = (SELECT TOP 1 name FROM samplenames ORDER By NEWID())
原文由 BradC 发布,翻译遵循 CC BY-SA 4.0 许可协议
匿名化数据可能很棘手,如果做得不正确,可能会给您带来麻烦,就像 AOL 不久前发布搜索数据时 发生的事情一样。在尝试转换现有客户数据之前,我会不惜一切代价尝试从头开始创建测试数据。事情可能会导致您能够使用诸如行为分析和其他您可能不认为敏感的数据点之类的东西来确定数据属于谁。我宁愿安全也不愿后悔。