Benford()-Methode

Zählt, wie oft jede führende Ziffer (1–9) oder führende Ziffernkombination in einer numerischen Spalte vorkommt, und vergleicht das tatsächliche mit dem erwarteten Ergebnis. Das erwartete Ergebnis wird mittels der Benford-Formel errechnet.

Syntax

datenrahmen_name.benford(on = "numerische_spalte", leading = anzahl_ziffern, addbounds = True|False)

Parameter

Name Beschreibung
on = "numerische_spalte"

Die zu analysierende numerische Spalte.

Hinweis

Wählen Sie eine Spalte, die „natürlich auftretende Zahlen“ wie zum Beispiel Transaktionsbeträge enthält. Die Benford-Analyse eignet sich nicht für numerische Daten, die auf irgendeine Weise eingeschränkt sind.

leading = anzahl_ziffern

Optional

Die Anzahl der zu analysierenden führenden Ziffern.

Wenn leading weggelassen wird, wird der Standardwert „1“ verwendet.

addbounds = True | False

Optional

  • True Berechnete Werte für die Ober- und Untergrenze in die Ausgabeergebnisse aufnehmen
  • False Berechnete Werte für die Ober- und Untergrenze nicht in die Ausgabeergebnisse aufnehmen

Wenn zwei oder mehr Ausgabeergebnisse die Grenzen überschreiten, könnten die Daten manipuliert worden sein und sollten untersucht werden.

Wenn Sie den Parameter auslassen, sind die oberen und unteren Grenzwerte nicht eingeschlossen.

Gibt zurück

HCL-Datenrahmen zurück.

Beispiele

Numerische Spalte auf Unregelmäßigkeiten der führenden Ziffern testen

Verwenden Sie die benford()-Methode, um die zwei führenden Ziffern der Spalte Amount auf Abweichungen von den erwarteten Auszählungen zu testen:

accounts_receivable.benford(on = "Amount", leading = 2, addbounds = True)