Detección de duplicados

Los valores duplicados en uno o más campos, o los registros duplicados, pueden deberse a errores en la entrada de datos o a actividades fraudulentas, como la división de las transacciones de tarjetas de crédito para evitar investigaciones.

Requisito de valores exclusivos

Los campos que jamás deberían contener duplicados son aquellos en los cuales los valores identifican registros de manera exclusiva. Por ejemplo, una tabla de empleados jamás debería tener números de empleado duplicados porque cada número debería identificar de manera exclusiva a un empleado.

Duplicados válidos

Los valores duplicados también pueden ser válidos. Por ejemplo, una tabla de transacciones podría tener números de cliente duplicados debido a la existencia de varias transacciones de los mismos clientes.

Diferentes tipos de comprobación de duplicados

Puede utilizar Analytics para comprobar si hay duplicados de las siguientes maneras:

Alcance de la prueba Utilice esta prueba cuando:
Un campo

Todos los valores de un campo determinado deban ser únicos, como los números de empleado o los números de cheque.

Dos o más campos en combinación

La exclusividad no sea un requisito de ningún campo aislado, pero sea un requisito de ciertos campos cuando están en combinación.

Ejemplo

En un archivo de nómina que cubra todo un año, el campo de número de empleado y el campo de fecha de pago contendrán varios duplicados. Los empleados reciben su paga cada dos semanas y muchos de ellos la reciben en la misma fecha.

Sin embargo, un empleado individual debería aparecer tan solo una vez para una fecha determinada. Si existe un duplicado en los campos número de empleado y fecha de pago combinados, es posible que a un empleado se le haya pagado dos veces por el mismo período de pago.

Todos los campos de un registro

Para comprobar la existencia de registros duplicados completos, en los cuales todos los campos del registro están duplicados. Los registros totalmente duplicados podrían deberse a errores en la entrada de datos o a otras irregularidades en las transacciones.

Pasos

Puede realizar pruebas en uno o más campos en la tabla activa para detectar si hay valores duplicados o registros duplicados completos.

Quitar duplicados

Puede utilizar la operación de resumen para quitar registros o valores duplicados de un conjunto de datos y guardar los registros o valores únicos restantes en una nueva tabla de Analytics.

Ayuda de Analytics 14.1