Método benford()

Cuenta el número de veces que aparece cada dígito inicial (1-9) o la combinación de dígitos iniciales en una columna, y compara el recuento real con el esperado. El recuento esperado se calcula usando la fórmula Benford.

Sintaxis

nombre_marco_de_datos.benford(on = "columna_numérica", leading = número_de_dígitos, addbounds = True|False)

Parámetros

Nombre Descripción
on = "columna_numérica"

La columna numérica que se debe analizar.

Nota

Seleccione una columna que contenga "números que aparecen de forma natural", como los importes de las transacciones. El análisis de Benford no es adecuado para los datos numéricos que tienen algún tipo de limitación.

leading = número_de_dígitos

opcional

El número de dígitos iniciales que se analizará.

Si omite leading, se utiliza el valor predeterminado 1.

addbounds = True | False

opcional

  • True Incluye los valores límite superior e inferior calculados en los resultados de la salida.
  • False No incluye los valores límite superior e inferior en los resultados de la salida.

Si uno o más recuentos de los resultados de la salida supera cualquiera de estos límites, es posible que los datos hayan sido manipulados y es necesaria una investigación.

Si omite el parámetro, no se incluyen los valores límite superior e inferior.

Devuelve

Marco de datos de HCL.

Ejemplos

Probar una columna numérica en busca de irregularidades en los dígitos iniciales

Usted utiliza el método benford() para probar los dos dígitos iniciales en la columna Amount en busca de desviaciones respecto de los recuentos esperados:

accounts_receivable.benford(on = "Amount", leading = 2, addbounds = True)