首页 » 技术资讯 » 【干货】数据质量业务规则类型汇总(数据规则值域业务验证)「常见的数据质量业务规则类型」

【干货】数据质量业务规则类型汇总(数据规则值域业务验证)「常见的数据质量业务规则类型」

乖囧猫 2024-07-23 20:02:04 技术资讯 0

扫一扫用手机浏览

文章目录 [+]

数据质量业务规则描述了数据应该如何存在,以确保在组织内的使用和有效性。
这些规则可以与质量维度保持一致,并用于描述数据质量需求。
例如,可以通过数据输入选择列表和数据集成查找来强制执行所有州代码字段,并测量有效或无效记录的等级。

业务规则通常在软件中实现,或通过使用文档模板进行数据输入来实现。
一些常见的简单业务规则类型包括:

·1.定义一致性:确认对数据定义的理解已在组织的各个流程中得到正确实施和使用。
确认包括在计算字段上的算法一致性,包括任何时间或当地约束以及汇总和状态相互依赖规则。

【干货】数据质量业务规则类型汇总(数据规则值域业务验证) 【干货】数据质量业务规则类型汇总(数据规则值域业务验证) 技术资讯
(图片来自网络侵删)

·2.值存在和记录完整性:定义缺失值可接受或不可接受的条件的规则。

·3.格式合规性:一个或多个模式指定分配给数据元素的值,例如格式化电话号码的标准。

【干货】数据质量业务规则类型汇总(数据规则值域业务验证) 【干货】数据质量业务规则类型汇总(数据规则值域业务验证) 技术资讯
(图片来自网络侵删)

·4值域成员资格:指定在定义的数据值域中枚举的值中包括数据元素的分配值,例如STATE字段的2个字符的美国邮政编码。

·5.范围一致性:为数据元素分配的值必须在定义的数字词典或时间范围内,例如对于数字范围大于0且小于100。

·6.映射一致性:指示分配给数据元素的值必须与从值域中选择的值相对应,该值域映射到其他高效的对应值域。
STATE数据域再次提供了一个很好的示例,因为可以使用不同的值域(USPS邮政编码),FIPS2位数字代码全名)来表示州值,并且这些类型的规则可以验证"AL"和"01"映射到"阿拉巴马州"。

·7.一致性规则:条件性主张指的是根据那些属性的实际值维护两个(或多个)属性之间的关系,例如在邮政编码对应于特定州或省的地址验证。

·8。
准确性验证:将数据值与记录系统或其他已验证源(例如从供应商处购买的营销数据)中的相应值进行比较以验证这些值是否匹配。

·(x-(5x+3)=36,x-52+3-3=36)。

·9.唯一性验证:指定哪些实体必须具有唯一表示形式的规则,以及每个表示的实际对象是否存在一条且仅一条记录。

·10:及时性验证。
指示与数据可访问性和可用性预期相关的特征的规则。
其他类型的规则可能涉及聚合应用于数据实例集的功能(请参阅第13.4.5节)。
聚合检查的示例包括:

→1.验证文件中记录数量的合理性,这需要随着时间的推移保留统计信息以生成趋势。
→2.要验证从一组事务中计算出的平均金额是否合理,需要建立一个比较阈值,同时也可能需要参考一段时间内的统计数据。

→3.在指定时间范围内验证事务计数的预期差异。
这需要随着时间的推移保留统计数据,并使用它们来建立阈值。

标签:

相关文章