Detección de duplicados
Los valores duplicados en uno o más campos, o los registros duplicados, pueden deberse a errores en la entrada de datos o a actividades fraudulentas, como la división de las transacciones de tarjetas de crédito para evitar investigaciones.
Requisito de valores exclusivos
Los campos que jamás deberían contener duplicados son aquellos en los cuales los valores identifican registros de manera exclusiva. Por ejemplo, una tabla de empleados jamás debería tener números de empleado duplicados porque cada número debería identificar de manera exclusiva a un empleado.
Duplicados válidos
Los valores duplicados también pueden ser válidos. Por ejemplo, una tabla de transacciones podría tener números de cliente duplicados debido a la existencia de varias transacciones de los mismos clientes.
Diferentes tipos de comprobación de duplicados
Puede utilizar Analytics para comprobar si hay duplicados de las siguientes maneras:
| Alcance de la prueba | Utilice esta prueba cuando: |
|---|---|
| Un campo |
Todos los valores de un campo determinado deban ser únicos, como los números de empleado o los números de cheque. |
| Dos o más campos en combinación |
La exclusividad no sea un requisito de ningún campo aislado, pero sea un requisito de ciertos campos cuando están en combinación. EjemploEn un archivo de nómina que cubra todo un año, el campo de número de empleado y el campo de fecha de pago contendrán varios duplicados. Los empleados reciben su paga cada dos semanas y muchos de ellos la reciben en la misma fecha. Sin embargo, un empleado individual debería aparecer tan solo una vez para una fecha determinada. Si existe un duplicado en los campos número de empleado y fecha de pago combinados, es posible que a un empleado se le haya pagado dos veces por el mismo período de pago. |
| Todos los campos de un registro |
Para comprobar la existencia de registros duplicados completos, en los cuales todos los campos del registro están duplicados. Los registros totalmente duplicados podrían deberse a errores en la entrada de datos o a otras irregularidades en las transacciones. |
Ordenamiento y duplicados
En general, solo debe comprobar si hay duplicados utilizando uno o más campos clave ordenados. Los valores duplicados en un campo clave solo se pueden encontrar si son adyacentes.
Si busca duplicados en un campo clave sin ordenar, los valores duplicados que no son adyacentes no se reportan como duplicados. Si existen uno o más clústeres del mismo valor duplicado, se los reporta como duplicados, pero en grupos separados.
Según cuáles sean las metas de su análisis, tal vez sea conveniente comprobar si existen duplicados utilizando un campo sin ordenar. Por ejemplo, es posible que desee detectar únicamente los valores duplicados adyacentes en la tabla de origen e ignorar los valores duplicados que no son adyacentes.
Incluir el campo Número de grupo en la tabla de salida
Si lo desea, puede incluir el campo Número de grupo en la tabla de salida de duplicados. El campo le asigna un número creciente y en secuencia a cada grupo exclusivo de duplicados. La capacidad de hacer referencia a grupos de duplicados con números puede resultar útil al analizar los datos de la tabla de salida.
Filtrar la tabla de salida de duplicados por número de grupo
Usted utiliza varios campos clave en combinación para comprobar si existen registros duplicados en una tabla de cuentas por pagar:
- número de proveedor
- número de factura
- fecha de la factura
- importe de la factura
Desea filtrar la tabla de salida de duplicados que obtiene para que solo algunos grupos de duplicados sean procesados en una etapa posterior.
Crear un filtro utilizando una combinación de campos clave requeriría mucho trabajo. Por ejemplo:
SET FILTER TO ((Núm_proveedor = "11475") AND (Núm_factura = "8752512") AND (Fecha_factura = `20191021`) AND (Importe_factura = 7125.80)) OR ((Núm_proveedor = "12130") AND (Núm_factura= "589134") AND (Fecha_factura = `20191117`) AND (Importe_factura = 10531.71)) OR ((Núm_proveedor = "13440") AND (Núm_factura = "5518912") AND (Fecha_factura = `20191015`) AND (Importe_factura = 11068.20))
Por el contrario, usted logra el mismo resultado si crea un filtro sobre la base de un número de grupo:
SET FILTER TO MATCH(GROUP_NUM, 3 , 8, 11)
Pasos
Puede realizar pruebas en uno o más campos en la tabla activa para detectar si hay valores duplicados o registros duplicados completos.
Puede comprobar los campos de carácter, numéricos y de fechahora en busca de duplicados. Si en un campo de carácter aparecen tanto letras como números, se comprobarán todos los caracteres alfanuméricos.
Nota
Para que los resultados sean válidos, los campos que se están verificando deben estar en orden secuencial antes de la comprobación. Puede ordenar los campos de antemano o utilizar la opción Preordenar durante la comprobación de duplicados.
Seleccionar los campos
- Abra la tabla que desea poner a prueba para determinar los valores duplicados.
- Seleccione .
- Si desea detectar duplicados en uno o más campos, haga lo siguiente:
- En la ficha Principal, seleccione los campos que desee probar en la lista Duplicados en, o haga clic en Duplicados en para seleccionar los campos o para crear una expresión.
El orden en que seleccione los campos es el orden en el cual aparecen las columnas en los resultados. Si está anexando los resultados a una tabla de Analytics existente, la selección y el orden de columna deben ser idénticos a la selección de columna y el orden en la tabla existente.
- Si hizo clic en Duplicados en, puede especificar opcionalmente un criterio de ordenamiento descendente en los resultados de salida para uno o más campos seleccionados haciendo clic en la flecha de ordenamiento
(el valor predeterminado es ascendente). - Seleccione una o más Listas de campos para incluir cualesquiera campos adicionales en los resultados de salida, o haga clic en Lista de campos para seleccionar campos, para Agregar todos los campos, o para crear una expresión.
Los campos adicionales pueden proporcionar un contexto útil para los resultados. Los campos seleccionados para la detección de duplicados se muestran automáticamente al comienzo cualquier registro de resultados y no es necesario seleccionarlos específicamente en Listar campos.
- Opcional. Seleccione Agregar grupos si desea incluir el campo Número de grupo en la tabla de salida.
El campo Número de grupo le asigna un número creciente y en secuencia a cada grupo exclusivo de duplicados.
- En la ficha Principal, seleccione los campos que desee probar en la lista Duplicados en, o haga clic en Duplicados en para seleccionar los campos o para crear una expresión.
- Si desea detectar registros duplicados completos, haga lo siguiente:
- En la ficha Principal, haga clic en Duplicados en.
- Haga clic en Agregar todos para agregar todos los campos a los Campos seleccionados.
- Opcionalmente, especifique un orden de ordenamiento descendente en los resultados de salida para uno o más campos haciendo clic en la flecha de ordenamiento
(el valor predeterminado es ascendente). - Haga clic en Aceptar.
No es necesario seleccionar campos de la lista Lista de campos porque todos los campos de la tabla se muestran automáticamente en los registros de resultados.
- Opcional. Seleccione Agregar grupos si desea incluir el campo Número de grupo en la tabla de salida.
El campo Número de grupo le asigna un número creciente y en secuencia a cada grupo exclusivo de duplicados.
Excluir registros del procesamiento (opcional)
Si hay registros en la vista principal que desee excluir del procesamiento, introduzca una condición en el cuadro de texto Si, o haga clic en Si para crear un enunciado IF usando Generador de expresiones.
Nota
La condición IF se evalúa únicamente con los registros que quedan en una tabla después de aplicar las opciones de alcance (First, Next y While).
El enunciado IF considera todos los registros en la vista principal y filtra los que no cumplan la condición especificada.
Quitar la selección de Preordenar (opcional)
Si el campo o campos que está probando ya están ordenados basándose en una operación previa, opcionalmente puede deseleccionar Preordenar para ahorrar tiempo cuando realice pruebas en tablas grandes para detectar duplicados.
Nota
Si deselecciona Preordenar, el campo o campos que seleccione para pruebas de duplicados debe coincidir con el campo o los campos que previamente fueron ordenados para obtener resultados válidos.
Si hay una falta de correspondencia entre los campos seleccionados y los ordenados, los resultados irán acompañados del mensaje Advertencia: Archivo fuera de secuencia. Si envía los resultados a una tabla de Analytics, el mensaje de advertencia aparece en el registro de comandos.
Si los datos en los campos no están ordenados, debe dejar Preordenar seleccionado para garantizar que todos los duplicados sean encontrados.
Configurar la salida
- Haga clic en la ficha Salida.
- Seleccione la opción de salida correspondiente en el panel En:
- Pantalla - Seleccione esta opción para mostrar los resultados en el área de visualización Analytics.
Consejo
Puede hacer clic en cualquier valor de resultado enlazado en el área de visualización para ver con mayor detalle el o los registros asociados de la tabla de origen.
Si su tabla resultante contiene una gran cantidad de registros, resulta más rápido y útil guardar los resultados en un archivo en lugar de mostrarlos en pantalla.
- Imprimir - Seleccione esta opción para enviar los resultados a la impresora predeterminada.
- Gráfico - Seleccione esta opción para crear un gráfico de los resultados y mostrarlo en el área de visualización Analytics.
- Archivo – Seleccione esta opción para guardar o anexar los resultados a un archivo de texto. El archivo se guarda fuera de Analytics.
Nota
Las opciones de salida que no se aplican a una operación de análisis en particular se desactivan.
- Pantalla - Seleccione esta opción para mostrar los resultados en el área de visualización Analytics.
- Si seleccionó Archivo como el tipo de salida, especifique la siguiente información en el panel Como:
- Tipo de archivo – Seleccione Tabla Analytics para guardar los resultados en una nueva tabla Analytics, o anexar los resultados a una tabla Analytics existente. Seleccione Archivo de texto ASCII o Archivo de texto Unicode (dependiendo de cuál edición de Analytics esté utilizando) para guardar o anexar los resultados a un archivo de texto.
- Nombre - Escriba un nombre de archivo en el cuadro de texto Nombre. O haga clic en Nombre e introduzca el nombre del archivo, o seleccione un archivo existente en el cuadro de diálogo Guardar o Guardar archivo como para sobrescribir o anexar al archivo. Si Analytics pre-completa un nombre de archivo, puede aceptar el nombre pre-completado o cambiarlo.
También puede especificar una ruta de acceso absoluta o relativa, o navegar a una carpeta diferente, para guardar o anexar el archivo en una ubicación distinta a la ubicación del proyecto. Por ejemplo: C:\Resultados\Salida.fil o Resultados\Salida.fil.
- Local – Solo está habilitado cuando se está conectado a una tabla de servidores y se están guardando o anexando los resultados una tabla Analytics. Seleccione Local para guardar el archivo en la misma ubicación del proyecto, o para especificar una ruta de acceso o navegar a una carpeta local diferente. Deje Local sin seleccionar para guardar el archivo en la carpeta Prefijo de un servidor.
Nota
Para los resultados de salida obtenidos a partir del análisis o el procesamiento de las tablas de servidor de AX, seleccione Local. No puede quitar la selección de la configuración Local para importar tablas de resultados al Servidor de AX.
- Dependiendo del tipo de salida, puede opcionalmente especificar un Encabezado y/o un Pie de página en los cuadros de texto.
Los encabezados y pies de página están centrados como opción predeterminada. Escriba un corchete de ángulo izquierdo (<) antes del texto de encabezado o pie de página para alinear el texto hacia la izquierda. Haga clic en Encabezado o Pie de página para introducir un encabezado o pie de página de más de una línea. Otra posibilidad consiste en introducir un “punto y coma” (;) como carácter de interrupción de línea en el cuadro de texto de encabezado o pie de página. La alineación hacia la izquierda de múltiples líneas exige un corchete de ángulo izquierdo al comienzo de cada línea.
Especificar el alcance de la operación
- Haga clic en la ficha Propiedades.
-
Seleccione la opción correspondiente en el panel Alcance.
- Todos/as
- Primeros
- Siguiente
- Mientras
Mostrar más
Todos/as Esta opción está seleccionada como opción predeterminada. Déjela seleccionada para especificar que todos los registros en la vista principal sean procesados. Primeros Seleccione esta opción e introduzca un número en el cuadro de texto para comenzar el procesamiento en el primer registro en la vista principal e incluir sólo el número especificado de registros. Siguiente Seleccione esta opción e introduzca un número en el cuadro de texto para comenzar el procesamiento en el registro actualmente seleccionado de la vista de la tabla e incluir solo el número especificado de registros. El número de registro real en la columna más a la izquierda debe ser seleccionado, no datos en la fila. Mientras Seleccione esta opción para usar un enunciado WHILE para limitar el procesamiento de registros en la vista basándose en un criterio o un conjunto de criterios. Usted puede introducir una condición en el cuadro de texto Mientras, o hacer clic en Mientras para crear un enunciado WHILE utilizando Generador de expresiones.
Un enunciado WHILE permite que los registros en la vista principal sean procesados sólo mientras la condición especificada se evalúe como verdadera. Tan pronto como la condición se evalúa como falsa, el procesamiento termina, y no se consideran más registros. Puede utilizar la opción Mientras junto con las opciones Todos, Primero o Siguiente. El procesamiento de registros se detiene en cuanto se alcanza un límite.
Nota
El número de registros especificados en las opciones Primero o Siguiente hace referencia tanto al orden físico o al orden indexado de registros en una tabla, y hace caso omiso de cualquier filtrado u ordenación rápida aplicados a la vista. Sin embargo, los resultados de las operaciones analíticas respetan cualquier filtrado.
Si a una vista se aplica ordenación rápida, Siguiente se comporta como Primero.
Finalizar la configuración
- Si seleccionó Archivo como el tipo de salida y desea anexar los resultados de la salida al final de un archivo existente, realice una de las siguientes acciones:
Seleccione Anexar al archivo existente si está anexando a un archivo de texto o a una tabla de Analytics y está seguro de que tienen la misma estructura que los resultados de la salida.
Deje Anexar al archivo existente sin seleccionar si está anexando a una tabla de Analytics y desea que Analytics compare las longitudes de los registros de los resultados de la salida y la tabla existente. Si las longitudes de los registros no son idénticas, la estructura de datos no es idéntica, y la operación de anexar no se podrá realizar correctamente.
Nota
Se recomienda dejar Anexar a archivo existente sin seleccionar si no está seguro de que los resultados de la salida y la tabla existente tengan una estructura de datos idéntica. Si desea más información acerca de la anexión y la estructura de datos, consulte Anexión de resultados de la salida a una tabla existente.
- Si seleccionó Archivo (Tabla de Analytics) como el tipo de salida, seleccione o suspenda la selección de Utilizar tabla de salida dependiendo de si desea que la tabla de Analytics que contiene los resultados de salida se abra automáticamente al culminar la operación.
- Haga clic en Aceptar.
Nota
Solo se muestran los registros o los valores duplicados y no la instancia inicial del valor o del registro, si usted completa los dos pasos que se indican a continuación:
- envía los resultados a la pantalla o a un archivo de texto
- incluye únicamente los campos comprobados en los resultados de la salida y no selecciona ningún otro campo
Si envía la salida a la pantalla, puede hacer clic en cualquier valor para ver la instancia inicial de un valor o registro junto con los duplicados.
- Si aparece el mensaje de sobrescritura, seleccione la opción adecuada.
Si espera que aparezca la opción Anexar, pero ésta no aparece, haga clic en No para cancelar la operación y consulte Anexión de resultados de la salida a una tabla existente.
Quitar duplicados
Puede utilizar la operación de resumen para quitar registros o valores duplicados de un conjunto de datos y guardar los registros o valores únicos restantes en una nueva tabla de Analytics.
Seleccionar los campos
- Abra la tabla de la cual desea quitar valores duplicados.
- Seleccione .
- En la ficha Principal, realice una de las siguientes acciones:
- Seleccione el o los campos que pueden contener valores duplicados de la lista Resumir sobre.
- Haga clic en Resumir sobre para seleccionar el campo o los campos, o para crear una expresión.
El orden en que seleccione los campos es el orden en el cual aparecen las columnas en los resultados.
Nota
Seleccione los campos adecuados para lograr el grado deseado de exclusividad.
Por ejemplo, si desea quitar registros de empleados duplicados y selecciona únicamente el campo de apellido, corre el riesgo de eliminar todos los registros de los empleados que tienen el mismo apellido pero un nombre diferente. Seleccione tanto el campo de nombre como el de apellido para aumentar el nivel de exclusividad.
Para quitar solo los registros duplicados exactos, haga clic en Resumir sobre y Agregar todos.
- No seleccione Campos de Subtotal.
- Opcional. Realice una de las siguientes acciones:
- Desde la lista Otros campos, seleccione el o los otros campos para incluirlos en los resultados de la salida.
- Haga clic en Otros campos para seleccionar el campo o los campos, o para crear una expresión.
Nota
Seleccione únicamente campos que contengan el mismo valor para todos los registros de cada grupo resumido. Si desea obtener más información, consulte La opción Otros campos.
Quitar la selección de Preordenar (opcional)
Si el campo que puede contener valores duplicados ya está ordenado, puede suspender la selección de Preordenar. Si los datos del campo no están ordenados, debe dejar Preordenar seleccionado para asegurar resultados válidos.
Excluir registros del procesamiento (opcional)
Si hay registros en la vista principal que desee excluir del procesamiento, introduzca una condición en el cuadro de texto Si, o haga clic en Si para crear un enunciado IF usando Generador de expresiones.
Nota
La condición IF se evalúa únicamente con los registros que quedan en una tabla después de aplicar las opciones de alcance (First, Next y While).
El enunciado IF considera todos los registros en la vista principal y filtra los que no cumplan la condición especificada.
Configurar la salida
- Haga clic en la ficha Salida.
- En el panel En, seleccione Archivo.
- Especifique la siguiente información en el panel Como:
Tipo de archivo – Tabla de Analytics es la única opción. Guarda los resultados en una nueva tabla de Analytics o anexa los resultados en una tabla Analytics existente.
Nombre - Escriba un nombre de tabla en el cuadro de texto Nombre. O haga clic en Nombre e introduzca el nombre del archivo, o seleccione un archivo existente en el cuadro de diálogo Guardar o Guardar archivo como para sobrescribir o anexar a la tabla. Si Analytics pre-completa un nombre de tabla, puede aceptar el nombre pre-completado o cambiarlo.
También puede especificar una ruta de acceso absoluta o relativa, o navegar a una carpeta diferente, para guardar o anexar la tabla en un lugar distinto al lugar de la ubicación del proyecto. Por ejemplo: C:\Resultados\Sin_duplicados.fil o Resultados\Sin_duplicados.fil.
Local – Sólo está habilitada cuando se está conectado a una tabla de servidores. Seleccione Local para guardar la tabla de salida en la misma ubicación del proyecto, o para especificar una ruta de acceso o navegar a una carpeta local diferente. Deje Local sin seleccionar para guardar la tabla de salida en la carpeta Prefijo en el servidor Analytics.
Nota
Para los resultados de salida obtenidos a partir del análisis o el procesamiento de las tablas del servidor Analytics Exchange, seleccione Local. No puede utilizar la configuración Local para importar tablas de resultados al Servidor de AX.
Especificar el alcance de la operación
- Haga clic en la ficha Propiedades.
-
Seleccione la opción correspondiente en el panel Alcance.
- Todos/as
- Primeros
- Siguiente
- Mientras
Mostrar más
Todos/as Esta opción está seleccionada como opción predeterminada. Déjela seleccionada para especificar que todos los registros en la vista principal sean procesados. Primeros Seleccione esta opción e introduzca un número en el cuadro de texto para comenzar el procesamiento en el primer registro en la vista principal e incluir sólo el número especificado de registros. Siguiente Seleccione esta opción e introduzca un número en el cuadro de texto para comenzar el procesamiento en el registro actualmente seleccionado de la vista de la tabla e incluir solo el número especificado de registros. El número de registro real en la columna más a la izquierda debe ser seleccionado, no datos en la fila. Mientras Seleccione esta opción para usar un enunciado WHILE para limitar el procesamiento de registros en la vista basándose en un criterio o un conjunto de criterios. Usted puede introducir una condición en el cuadro de texto Mientras, o hacer clic en Mientras para crear un enunciado WHILE utilizando Generador de expresiones.
Un enunciado WHILE permite que los registros en la vista principal sean procesados sólo mientras la condición especificada se evalúe como verdadera. Tan pronto como la condición se evalúa como falsa, el procesamiento termina, y no se consideran más registros. Puede utilizar la opción Mientras junto con las opciones Todos, Primero o Siguiente. El procesamiento de registros se detiene en cuanto se alcanza un límite.
Nota
El número de registros especificados en las opciones Primero o Siguiente hace referencia tanto al orden físico o al orden indexado de registros en una tabla, y hace caso omiso de cualquier filtrado u ordenación rápida aplicados a la vista. Sin embargo, los resultados de las operaciones analíticas respetan cualquier filtrado.
Si a una vista se aplica ordenación rápida, Siguiente se comporta como Primero.
Finalizar la configuración
- Seleccione o suspenda la selección de Utilizar tabla de salida dependiendo de si desea que la tabla Analytics que contiene los resultados de salida se abra automáticamente al culminar la operación.
- Si desea anexar los resultados de salida al final de una tabla existente de Analytics, realice una de las siguientes acciones:
Seleccione Anexar a un archivo existente si está seguro de que los resultados de salida y la tabla existente son idénticos en estructura.
Deje Anexar al archivo existente sin seleccionar si desea que Analytics compare las longitudes de los registros de los resultados de salida y la tabla existente. Si las longitudes de los registros no son idénticas, la estructura de datos no es idéntica, y la operación de anexar no se podrá realizar correctamente.
Nota
Se recomienda dejar Anexar a archivo existente sin seleccionar si no está seguro de que los resultados de la salida y la tabla existente tengan una estructura de datos idéntica. Si desea más información acerca de la anexión y la estructura de datos, consulte Anexión de resultados de la salida a una tabla existente.
- Haga clic en Aceptar.
- Si aparece el mensaje de sobrescritura, seleccione la opción adecuada.
Si espera que aparezca la opción Anexar, pero ésta no aparece, haga clic en No para cancelar la operación y consulte Anexión de resultados de la salida a una tabla existente.