如今,企业的许多业务决策正在越来越依赖数据的驱动,产品改进、市场营销、广告趋势、业务风险和产品性能——这些都是根据准确数据进行质量决策的商业要素。
尽管数据对企业非常重要,但不可否认的是,企业数据也可能因不准确而受损。最近的研究表明,脏数据事件使美国的商业组织平均每年损失 1500 万美元。2018 年的一份令人震惊的报告显示,三星因数据不良损失了约 3 亿美元。
什么是脏数据?
脏数据是指错误、重复或丢失的客户或业务信息。当经理错误地复制客户记录、有人拼错重要数据记录、数据输入工具自动填写错误信息或填写垃圾邮件,或者日期格式应用不一致时,就会出现脏数据。由于人与数据在不停地交互,几乎不可能始终保持数据的完整性和准确性,这使得数据成为攻击者可以瞄准和利用的武器。
脏数据的类型
以下是可能损坏大多数企业数据库完整性的脏数据类型。
重复数据
重复数据是指与无意输入到数据库中的另一个数据相同的数据条目。联系人、潜在客户和客户信息是最常见的重复对象。
陈旧资料
过时的数据包含很多不再相关的信息。例如,旧的服务器会话 cookie、不再准确的网络信息,以及组织通过品牌重塑阶段的陈旧信息。
不完整的数据
不完整的数据可能是主数据记录中缺少重要字段的记录。一些重要的字段包括名字、姓氏、行业类型和电话号码。
不准确或不正确的数据
当生成的字段值超出可接受的值范围时,可能会导致数据不正确。例如,月份字段应该只接受 1 到 12 之间的值,地址必须是真实的住宅或办公室地点。当这些可接受的值被遗漏时,我们可以称之为不准确的数据。
不一致的数据
当一个条目在其他系统上具有多种表示形式时,数据被称为不一致。数据不一致的一个主要问题是,当您必须考虑相同标题和行业的所有变量时,它会影响分析并阻碍数据分割。
脏数据引发的网络安全问题
随着众多行业数据泄露事件的增加,脏数据引发了一些新的网络安全问题。
针对网络融合中心传播虚假信息
许多企业为承担网络安全职责而创建了网络融合中心,以增加各个团队之间的沟通。网络融合中心将自动化技术与从各种来源收集的数据相结合,为业务和安全决策提供信息的洞察力。不幸的是,攻击者有可能利用网络融合中心对商业活动的影响力来操纵数据和传播虚假信息,误导企业的判断决策。
更多的攻击者将专注于非法数据
攻击者继续测试新策略,并进行更隐蔽和更有针对性的攻击,以提高他们的成功率并规避法律的审判。他们积极寻找虚假信息来损害企业的声誉、欺骗消费者或改变事件的进程。攻击者有可能将注意力转向非法数据操纵,以破坏信息的完整性和合法性,从而破坏企业赖以促进业务发展的数据的完整性。
数字孪生将使攻击面加倍
为了根据实际行为收集数据,使用模拟和机器学习来创建物理对象的数字孪生正在得到更多而应用。制造商的数字孪生使用速度正在加快,以简化产品开发、提高跟踪能力和预测财务结果。由于数字孪生使用了真实世界的数据,因此任何有权访问数据的人都可以看到有关其物理副本的重要细节。攻击者可以利用数字孪生漏洞在制造和供应链中造成停机。
企业如何在脏数据环境中保护自己
指明关键资产
列举基本信息资产是第一步。接下来,专注于创建、实施和维护组织计划,以处理这些关键资产中的数据中毒事件。考虑部署具有内置数据治理功能的平台,因为这些功能提供了对数据管理各个方面的监控和故障排除的控制,包括数据完整性。
使用自动化
随着网络融合中心的发展,密切关注数据和情报输入的准确性。有必要定期审查自动化系统,尤其是它们造成中断的可能性。企业还应该设置不违背可靠性和安全性要求的自动化阈值。针对突发的网络融合中心数据完整性问题,制定、实践和分类响应策略。
使用数据清理
为进一步确保为网络融合中心提供数据的完整性,采用数据清理程序并制定策略,允许业务和 IT 团队合作提高网络融合中心的准确性和有效性。
了解数字孪生
如果安全团队熟悉数字孪生及其与大公司的关系,他们将能够更好地监控和管理数字孪生。尝试与数字孪生供应商建立联系,以评估他们的安全能力。检查数字孪生与其物理副本之间的软件连接是否存在弱点。