benford() メソッド

数値列に表示される最初の桁(1 ~ 9)や最初の桁の組み合わせの数をカウントし、実数と予測数を比較します。予測数はベンフォードの法則によって計算されます。

構文

データフレーム名.benford(on = "数値列", leading = 桁数, addbounds = True|False)

パラメーター

名前 説明
on = "numeric_column"

分析する数値列。

メモ

取引金額などの「自然発生数」を含む列を選択します。ベンフォード分析は、いかなる方法でも制約を受けた数値データには適していません。

leading = number_of_digits

省略可能

分析する先頭桁数。

leading を省略した場合は、デフォルト値の 1 が使用されます。

addbounds = True | False

省略可能

  • True 計算された上限および下限値を出力結果に含めます。
  • False 計算された上限および下限値を出力結果に含めません。

出力結果の 2 つ以上のカウントが境界のいずれかを超える場合、データは操作された可能性があり、調査が必要になります。

パラメーターを省略した場合、上限と下限の境界値は含まれません。

戻り値

HCL データフレーム。

数値列の先頭の桁の不規則性をテストする

benford()メソッドを使用して、Amount 列の先頭の 2 桁が想定されたカウントから逸脱しているかどうかをテストします。

accounts_receivable.benford(on = "Amount", leading = 2, addbounds = True)