benford() 方法
统计一个数值列中各个前导数字 (1–9) 或前导数字组合的出现次数,并将实际计数与预期计数进行比较。使用 Benford 公式计算预期计数结果。
语法
dataframe_name.benford(on = "数值列", leading = 前导数字个数, addbounds = True|False)
参数
名称 | 描述 |
---|---|
on = "数值列" |
要分析的数值列。 说明 选择一个包含“自然发生数”(如交易金额)的列。Benford 分析不适合于以任何方式受到约束的数值数据。 |
leading = 前导数字个数 可选 |
要分析的前导数字的数目。 如果您省略 leading,则使用默认值 1。 |
addbounds = True | False 可选 |
如果输出结果中的两个或更多个计数超过任一限值,则该数据可能已被操纵,应该进行调查。 如果您省略该参数,则不会包括上限值和下限值。 |
返回
HCL 数据帧。
示例
测试数值列是否存在前导数字不规则的情况
您可以使用 benford() 方法测试 Amount 列中的两个前导数字是否偏离预期计数:
accounts_receivable.benford(on = "Amount", leading = 2, addbounds = True)