数据完整性定义
数据完整性是一个概念和流程,可确保组织数据的准确性、完整性、一致性和有效性。通过遵循该流程,组织不仅可以确保数据的完整性,还可以确保数据库中的数据准确无误。
随着数据量呈指数级 增长,数据完整性 的重要性也随之增加。主要组织越来越依赖数据集成,并能够准确解释信息,以预测消费者行为、评估市场活动并降低潜在的数据安全风险。这对于数据挖掘至关重要,因此数据科学家可以使用正确的信息。
数据完整性的类型
组织可以通过完整性限制来保持数据完整性,这些限制定义了删除、插入和更新信息等操作的规则和程序。数据完整性的定义可以在分层和关系数据库中执行,例如企业资源规划 (ERP)、客户管理 (CRM) 和供应链管理 (CRM) 系统。
组织可以通过以下途径实现数据完整性:
物理完整性
物理完整性意味着在存储和检索数据时保护数据的准确性、正确性和完整性。这通常受到停电、存储侵蚀、针对数据库功能的黑客和自然灾害等问题的影响,这些问题会妨碍准确的数据存储和检索。
逻辑完整性
逻辑完整性可确保数据保持不变,同时通过关系数据库以不同方式使用。这种方法还旨在保护数据免受黑客攻击或人为错误问题的影响,但这样做与物理完整性不同。
逻辑完整性有四种不同的格式:
1. 实体完整性
实体完整性是将数据存储在表格中的关系系统的一项功能,可以通过各种方式使用和链接。它依赖于主密钥和创建的唯一值来识别一条数据。这可确保数据不能多次列出,并且表中的字段不能为空。
2. 参考完整性
参考完整性是一系列流程,可确保数据以统一的方式保持存储和使用。数据库结构内嵌有定义如何使用外键的规则,确保只能进行适当的数据删除、更改和修改。这可以防止数据重复,并保证数据的准确性。
3. 域完整性
域完整性是一系列流程,可确保域内数据片段的准确性。域按允许表列包含的一组值以及限制可输入的数据量、格式和类型的限制和度量进行分类。
4. 用户定义的完整性
用户定义的完整性意味着用户会创建围绕数据的规则和限制,以符合其特定要求。当其他完整性流程无法保护组织的数据时,通常会使用这种方法,从而可以创建包含组织数据完整性措施的规则。