benford() 方法

统计一个数值列中各个前导数字 (1–9) 或前导数字组合的出现次数,并将实际计数与预期计数进行比较。使用 Benford 公式计算预期计数结果。

语法

dataframe_name.benford(on = "数值列", leading = 前导数字个数, addbounds = True|False)

参数

名称 描述
on = "数值列"

要分析的数值列。

说明

选择一个包含“自然发生数”(如交易金额)的列。Benford 分析不适合于以任何方式受到约束的数值数据。

leading = 前导数字个数

可选

要分析的前导数字的数目。

如果您省略 leading,则使用默认值 1。

addbounds = True | False

可选

  • True 在输出结果中包括计算上限值和下限值
  • False 不在输出结果中包括计算上限值和下限值

如果输出结果中的两个或更多个计数超过任一限值,则该数据可能已被操纵,应该进行调查。

如果您省略该参数,则不会包括上限值和下限值。

返回

HCL 数据帧。

示例

测试数值列是否存在前导数字不规则的情况

您可以使用 benford() 方法测试 Amount 列中的两个前导数字是否偏离预期计数:

accounts_receivable.benford(on = "Amount", leading = 2, addbounds = True)