benford() methode

Telt het aantal keren dat elk eerste cijfer (1-9), of combinatie van eerste cijfers, voorkomt in een numerieke kolom, en vergelijkt het werkelijke aantal met het verwachte aantal. De verwachte telling wordt berekend met behulp van de Benford-formule.

Syntaxis

dataframe_name.benford(on = "numeric_column", leading = number_of_digits, addbounds = Waar|Onwaar)

Parameters

Naam Beschrijving
on = "numeric_column"

De numerieke kolom om te analyseren.

Opmerking

Selecteer een kolom die "van nature voorkomende getallen" bevat, zoals transactiebedragen. Benford-analyse is niet geschikt voor numerieke gegevens die op enigerlei wijze beperkt zijn.

leading = number_of_digits

optioneel

Het aantal leidende cijfers dat moet worden geanalyseerd.

Als u leading weglaat, wordt de standaardwaarde van 1 gebruikt.

addbounds = Waar | Onwaar

optioneel

  • Waar berekeningsresultaten voor boven- en ondergrens opnemen in de uitvoerresultaten
  • Onwaar bovenste en onderste grenswaarden niet opnemen in de uitvoerresultaten

Als twee of meer tellingen in de uitvoerresultaten een van de grenzen overschrijden, zijn de gegevens mogelijk gemanipuleerd en moeten ze worden onderzocht.

Als u de parameter weglaat, worden de boven- en ondergrenswaarden niet opgenomen.

Retourneert

HCL-dataframe.

Voorbeelden

Een numerieke kolom testen op onregelmatigheden in het eerste cijfer

U gebruikt de benford()-methode om de eerste twee cijfers in de kolom Hoeveelheid te testen op afwijking van de verwachte aantallen:

accounts_receivable.benford(on = "Bedrag", leading = 2, addbounds = True)