执行 Benford 分析

Benford 分析统计一个域中各个前导数字 (1–9) 或前导数字组合的出现次数,并将实际计数与预期计数进行比较。

使用 Benford 公式计算的预期计数提供了 Benford 分布。在自然发生的数集中,前导数字的实际计数的频率分布应该近似于 Benford 分布。

如果所测试的数据中的一个或多个前导数字或者数字组合严重偏离 Benford 分布,则可能表明这些数字已被操纵。偏差也可能具有简单且合理的解释,并不必然表明存在操纵。

使用 Benford 分析可以测试哪些数据?

您只应使用 Benford 分析测试由“自然发生数”组成的数值数据,如记账金额、交易金额、费用或地址号码。Benford 分析不适合于以任何方式受到约束的数值数据。

请按照下列准则来识别适合于 Benford 分析的数值数据:

  • 数据集的大小 数据集必须足够大以支持有效的分布。Benford 分析可能无法为少于 500 个的记录提供可靠的结果。
  • 前导数字要求 从 1 到 9 的所有数字都必须具有作为前导数字出现的可能性。
  • 前导数字组合要求 从 0 到 9 的所有数字都必须具有作为第二个前导数字以及要分析的任何附加数字出现的可能性。
  • 受约束的数据 被按照预先规定的模式分配或者生成的数值数据不适合于 Benford 分析。例如,请勿使用 Benford 来分析以下数据:
    • 顺序支票或发票编号
    • 符合特定模式的社保号码或电话号码
    • 任何具有防止某些数字出现的范围的编号方案
  • 随机数 由随机数生成器生成的数字不适合于 Benford 分析。

用法详情

下表提供了有关在 Analytics 中使用 Benford 分析功能的详情。

前导数字个数 您最多可以分析六个前导数字。当分析四个或更多个前导数字时,必须将 Benford 分析输出发送到文件而不是显示在屏幕上或者发送到打印机。
处理时间 根据您所处理的记录数的不同,分析五个或者更多个前导数字可能花费数分钟。无论您分析多少个数字,您随时都可以按 Esc 终止该命令。
数据集大小 高效的 Benford 分析需要大型数据集。如果对于指定的数字个数而言,数据集可能太小,则 Analytics 会在结果输出中显示警告。
正值和负值 当您分别分析正值和负值时,反常数据更加明显。您可以在开始分析前使用过滤器区分两者。
零和非数值字符

包含零值的记录会被忽略,但会报告所忽略的零值记录的个数。

前导零、小数点和美元符号等数值格式字符、其他非数值数字以及不满足测试条件的记录也会被忽略。如果生成的数字个数小于指定的个数,Analytics 会向结果右侧添加零。

Benford 分析输出结果

Benford 分析生成以下输出结果:

前导数字 显示所测试的前导数字。例如,如果您指定一个前导数字,则会显示数字 1 到 9。如果您指定两个前导数字,则会显示数字 10 到 99。
实际计数 显示该域中的每个前导数字或前导数字组合的实际计数。
预期计数 显示通过 Benford 公式计算的每个前导数字或前导数字组合的预期计数。
Z 统计量比率 显示每个数字或数字组合的 Z 统计量比率,它是实际计数和预期计数之间距离的标准偏差的度量。例如,Z 统计量 0.500 表示标准偏差的一半。

下限

上限

(可选)

显示每个前导数字或数字组合的计数的计算下限值和上限值。

如果输出结果中的一个以上的数字或数字组合的实际计数超过任一限值,则该数据可能已被操纵,应该进行调查。

说明

仅当在 Benford 对话框中选择了包括上限和下限复选框时,才会包括下限上限值。

步骤

对域执行 Benford 分析,以发现是否有一个或多个前导数字或数字组合严重偏离 Benford 分布。

Analytics 14.1 帮助