Método benford()
Cuenta el número de veces que aparece cada dígito inicial (1-9) o la combinación de dígitos iniciales en una columna, y compara el recuento real con el esperado. El recuento esperado se calcula usando la fórmula Benford.
Sintaxis
nombre_marco_de_datos.benford(on = "columna_numérica", leading = número_de_dígitos, addbounds = True|False)
Parámetros
Nombre | Descripción |
---|---|
on = "columna_numérica" |
La columna numérica que se debe analizar. Nota Seleccione una columna que contenga "números que aparecen de forma natural", como los importes de las transacciones. El análisis de Benford no es adecuado para los datos numéricos que tienen algún tipo de limitación. |
leading = número_de_dígitos opcional |
El número de dígitos iniciales que se analizará. Si omite leading, se utiliza el valor predeterminado 1. |
addbounds = True | False opcional |
Si uno o más recuentos de los resultados de la salida supera cualquiera de estos límites, es posible que los datos hayan sido manipulados y es necesaria una investigación. Si omite el parámetro, no se incluyen los valores límite superior e inferior. |
Devuelve
Marco de datos de HCL.
Ejemplos
Probar una columna numérica en busca de irregularidades en los dígitos iniciales
Usted utiliza el método benford() para probar los dos dígitos iniciales en la columna Amount en busca de desviaciones respecto de los recuentos esperados:
accounts_receivable.benford(on = "Amount", leading = 2, addbounds = True)