Benford()-Methode
Zählt, wie oft jede führende Ziffer (1–9) oder führende Ziffernkombination in einer numerischen Spalte vorkommt, und vergleicht das tatsächliche mit dem erwarteten Ergebnis. Das erwartete Ergebnis wird mittels der Benford-Formel errechnet.
Syntax
datenrahmen_name.benford(on = "numerische_spalte", leading = anzahl_ziffern, addbounds = True|False)
Parameter
Name | Beschreibung |
---|---|
on = "numerische_spalte" |
Die zu analysierende numerische Spalte. Hinweis Wählen Sie eine Spalte, die „natürlich auftretende Zahlen“ wie zum Beispiel Transaktionsbeträge enthält. Die Benford-Analyse eignet sich nicht für numerische Daten, die auf irgendeine Weise eingeschränkt sind. |
leading = anzahl_ziffern Optional |
Die Anzahl der zu analysierenden führenden Ziffern. Wenn leading weggelassen wird, wird der Standardwert „1“ verwendet. |
addbounds = True | False Optional |
Wenn zwei oder mehr Ausgabeergebnisse die Grenzen überschreiten, könnten die Daten manipuliert worden sein und sollten untersucht werden. Wenn Sie den Parameter auslassen, sind die oberen und unteren Grenzwerte nicht eingeschlossen. |
Gibt zurück
HCL-Datenrahmen zurück.
Beispiele
Numerische Spalte auf Unregelmäßigkeiten der führenden Ziffern testen
Verwenden Sie die benford()-Methode, um die zwei führenden Ziffern der Spalte Amount auf Abweichungen von den erwarteten Auszählungen zu testen:
accounts_receivable.benford(on = "Amount", leading = 2, addbounds = True)