Méthode benford()

Compte le nombre d'occurrences de chaque chiffre de tête (1-9) ou combinaison de chiffres de tête dans une colonne numérique, et compare le compte réel au compte probable. Le compte probable est obtenu en utilisant la formule Benford.

Syntaxe

nom_cadre_données.benford(on = "colonne_numérique", leading = nombre_de_chiffres, addbounds = True|False)

Paramètres

Nom Description
on = "colonne_numérique"

La colonne numérique à analyser.

Remarque

Sélectionnez une colonne contenant des « nombres apparaissant naturellement », par exemple, des montants de transactions. L'analyse de Benford ne convient pas aux données numériques limitées d'une manière ou d'une autre.

leading = nombre_de_chiffres

facultatif

Nombre de chiffres de tête à analyser.

Si vous omettez leading, c'est la longueur par défaut de 1 qui est utilisée.

addbounds = True | False

facultatif

  • True inclut les valeurs calculées supérieures et inférieures dans les résultats de sortie
  • False n'inclut pas les valeurs calculées supérieures et inférieures dans les résultats de sortie

Si plusieurs comptes dans les résultats de sortie dépassent l'une de ces limites, il se peut que les données aient été manipulées. Elles doivent donc faire l'objet d'une étude plus approfondie.

Si vous ignorez le paramètre, les valeurs supérieures et inférieures ne sont pas incluses.

Renvoie

Un cadre de données HCL.

Exemples

Tester une colonne numérique pour y rechercher des irrégularités dans les chiffres de tête

Vous utilisez la méthode benford() pour effectuer un test permettant de rechercher des écarts parmi les deux chiffres de tête de la colonne Amount par rapport aux comptes probables :

accounts_receivable.benford(on = "Amount", leading = 2, addbounds = True)