Detección de duplicados
Concept Information
Los valores duplicados en uno o más campos, o los registros duplicados, pueden deberse a errores en la entrada de datos o a actividades fraudulentas, como la división de las transacciones de tarjetas de crédito para evitar investigaciones.
Requisito de valores exclusivos
Los campos que jamás deberían contener duplicados son aquellos en los cuales los valores identifican registros de manera exclusiva. Por ejemplo, una tabla de empleados jamás debería tener números de empleado duplicados porque cada número debería identificar de manera exclusiva a un empleado.
Duplicados válidos
Los valores duplicados también pueden ser válidos. Por ejemplo, una tabla de transacciones podría tener números de cliente duplicados debido a la existencia de varias transacciones de los mismos clientes.
Diferentes tipos de comprobación de duplicados
Puede utilizar Analytics para comprobar si hay duplicados de las siguientes maneras:
Alcance de la prueba | Utilice esta prueba cuando: |
---|---|
Un campo |
Todos los valores de un campo determinado deban ser únicos, como los números de empleado o los números de cheque. |
Dos o más campos en combinación |
La exclusividad no sea un requisito de ningún campo aislado, pero sea un requisito de ciertos campos cuando están en combinación. EjemploEn un archivo de nómina que cubra todo un año, el campo de número de empleado y el campo de fecha de pago contendrán varios duplicados. Los empleados reciben su paga cada dos semanas y muchos de ellos la reciben en la misma fecha. Sin embargo, un empleado individual debería aparecer tan solo una vez para una fecha determinada. Si existe un duplicado en los campos número de empleado y fecha de pago combinados, es posible que a un empleado se le haya pagado dos veces por el mismo período de pago. |
Todos los campos de un registro |
Para comprobar la existencia de registros duplicados completos, en los cuales todos los campos del registro están duplicados. Los registros totalmente duplicados podrían deberse a errores en la entrada de datos o a otras irregularidades en las transacciones. |
Ordenamiento y duplicados
En general, solo debe comprobar si hay duplicados utilizando uno o más campos clave ordenados. Los valores duplicados en un campo clave solo se pueden encontrar si son adyacentes.
Si busca duplicados en un campo clave sin ordenar, los valores duplicados que no son adyacentes no se reportan como duplicados. Si existen uno o más clústeres del mismo valor duplicado, se los reporta como duplicados, pero en grupos separados.
Según cuáles sean las metas de su análisis, tal vez sea conveniente comprobar si existen duplicados utilizando un campo sin ordenar. Por ejemplo, es posible que desee detectar únicamente los valores duplicados adyacentes en la tabla de origen e ignorar los valores duplicados que no son adyacentes.
Incluir el campo Número de grupo en la tabla de salida
Si lo desea, puede incluir el campo Número de grupo en la tabla de salida de duplicados. El campo le asigna un número creciente y en secuencia a cada grupo exclusivo de duplicados. La capacidad de hacer referencia a grupos de duplicados con números puede resultar útil al analizar los datos de la tabla de salida.
Filtrar la tabla de salida de duplicados por número de grupo
Usted utiliza varios campos clave en combinación para comprobar si existen registros duplicados en una tabla de cuentas por pagar:
- número de proveedor
- número de factura
- fecha de la factura
- importe de la factura
Desea filtrar la tabla de salida de duplicados que obtiene para que solo algunos grupos de duplicados sean procesados en una etapa posterior.
Crear un filtro utilizando una combinación de campos clave requeriría mucho trabajo. Por ejemplo:
SET FILTER TO ((Núm_proveedor = "11475") AND (Núm_factura = "8752512") AND (Fecha_factura = `20191021`) AND (Importe_factura = 7125.80)) OR ((Núm_proveedor = "12130") AND (Núm_factura= "589134") AND (Fecha_factura = `20191117`) AND (Importe_factura = 10531.71)) OR ((Núm_proveedor = "13440") AND (Núm_factura = "5518912") AND (Fecha_factura = `20191015`) AND (Importe_factura = 11068.20))
Por el contrario, usted logra el mismo resultado si crea un filtro sobre la base de un número de grupo:
SET FILTER TO MATCH(GROUP_NUM; 3 ; 8; 11)
Pasos
Puede realizar pruebas en uno o más campos en la tabla activa para detectar si hay valores duplicados o registros duplicados completos.

Puede comprobar los campos de carácter, numéricos y de fechahora en busca de duplicados. Si en un campo de carácter aparecen tanto letras como números, se comprobarán todos los caracteres alfanuméricos.
Nota
Para que los resultados sean válidos, los campos que se van a probar deben estar en orden secuencial antes de probarlos. Puede ordenar los campos previamente o utilizar la opción Preordenar durante la prueba de duplicados.
Seleccionar los campos
- En el Navegador, abra la tabla en la que desea probar si hay duplicados.
- Seleccione Analizar > Duplicados.
-
Si desea detectar duplicados en uno o más campos, haga lo siguiente:
-
En la ficha Principal, realice una de las siguientes acciones:
-
En la lista Duplicados en, seleccione los campos que desea probar.
-
Haga clic en Duplicados en para seleccionar los campos que desea probar o para crear una expresión.
El orden en que seleccione varios campos es el orden en el cual aparecerán los campos en los resultados de salida. Si desea anexar los resultados a una tabla de Analytics existente, la selección y el orden de los campos deben ser idénticos a la selección y el orden de los campos en la tabla existente.
-
-
Opcional. Si hizo clic en Duplicados en, haga clic en la flecha de ordenamiento
junto a los campos seleccionados para especificar un criterio descendente en el orden de los resultados de salida (la opción predeterminada es ascendente).
-
Realice una de las siguientes acciones:
-
En la lista Listar campos, seleccione uno o más campos adicionales para incluirlos en los resultados de salida.
-
Haga clic en Listar campos para seleccionar uno o más campos adicionales a fin de incluirlos o crear una expresión.
Los campos adicionales pueden proporcionar un contexto útil para los resultados. Los campos seleccionados para probar los duplicados se muestran automáticamente al comienzo de cualquier registro de resultados y no es necesario seleccionarlos específicamente en Listar campos.
-
-
Opcional. Seleccione Agregar grupos si desea incluir el campo Número de grupo en la tabla de salida.
El campo Número de grupo le asigna un número creciente y en secuencia a cada grupo exclusivo de duplicados.
-
-
Si desea detectar registros duplicados completos, haga lo siguiente:
-
En la ficha Principal, haga clic en Duplicados en.
-
Haga clic en Agregar todos para agregar todos los campos a los Campos seleccionados.
-
Opcional. Haga clic en la flecha de ordenamiento
junto a los campos seleccionados para especificar un criterio descendente en el orden de los resultados de salida (la opción predeterminada es ascendente).
-
Haga clic en Aceptar.
No es necesario seleccionar campos de la lista Listar campos porque todos los campos de la tabla se muestran automáticamente en los registros de resultados.
-
Opcional. Seleccione Agregar grupos si desea incluir el campo Número de grupo en la tabla de salida.
El campo Número de grupo le asigna un número creciente y en secuencia a cada grupo exclusivo de duplicados.
-
Excluir registros del procesamiento (opcional)
-
Si hay registros en la vista actual que desea excluir del procesamiento, elija una de las siguientes opciones:
-
Ingrese una condición en el cuadro de texto Si
-
Haga clic en Si para crear un enunciado IF utilizando el Generador de expresiones
La condición Si considera todos los registros de la vista principal y filtra los que no cumplen la condición especificada.
Nota
La condición Si se evalúa únicamente con los registros que quedan en una tabla después de aplicar las opciones de alcance (Primeros, Siguientes y Mientras).
-
Quitar la selección de Preordenar (opcional)
-
Si los campos de prueba ya están ordenados con base en una operación previa, deje sin seleccionar Preordenar para ahorrar tiempo al probar tablas de gran tamaño para duplicados.
Si los datos en los campos de prueba no están ordenados, debe dejar Preordenar seleccionado para asegurarse de que se encuentren todos los duplicados.
Nota
Si no selecciona Preordenar, los campos de prueba deben coincidir con los campos que se ordenaron previamente para que los resultados sean válidos.
El mensaje Advertencia: Archivo fuera de secuencia acompaña a los resultados si hay una falta de correspondencia entre los campos seleccionados y los ordenados. Si envía los resultados a una tabla de Analytics, el mensaje de advertencia aparece en el registro de comandos.
Configurar la salida
- Haga clic en la ficha Salida.
-
En el panel En, seleccione la opción de salida que corresponda.
Nota
Las opciones de salida no están habilitadas si no son aplicables a una operación de análisis en particular.
Opción Detalles Pantalla Muestra los resultados en el área de visualización de Analytics.
Consejo
Puede hacer clic en cualquier valor de resultado enlazado en el área de visualización para ver con mayor detalle el/los registro/s asociado/s de la tabla de origen.
Si su tabla resultante contiene una gran cantidad de registros, resulta más rápido y útil guardar los resultados en un archivo en lugar de mostrarlos en pantalla.
Imprimir Envía los resultados a la impresora predeterminada. Gráfico Crea un gráfico de los resultados y lo muestra en el área de visualización de Analytics. Archivo Guarda o anexa los resultados en una tabla de Analytics o en un archivo de texto, o sobrescribe una tabla o un archivo existentes.
- Tabla de Analytics La tabla se agrega al proyecto abierto si aún no está en el proyecto.Analytics
- Archivo de texto El archivo se guarda fuera de Analytics.Analytics
-
Si seleccionó Archivo como el tipo de salida, especifique la información apropiada en el panel Como.
Opción Detalles Tipo de archivo -
Tabla de Analytics: Guarda o anexa los resultados en una tabla de Analytics o sobrescribe una tabla existente.Analytics
-
Archivo de texto ASCII o archivo de texto Unicode: Guarda o anexa los resultados en un archivo de texto o sobrescribe un archivo existente.
Nombre -
Para guardar los resultados en una tabla o un archivo nuevos
Escriba un nombre de archivo en el cuadro de texto Nombre. Si Analytics pre-completa un nombre de archivo, puede aceptar el nombre pre-completado o cambiarlo.
-
Para anexar los resultados a una tabla o un archivo existentes, o para sobrescribir una tabla o un archivo existentes
Haga clic en Nombre y seleccione una tabla o un archivo existentes en el cuadro de diálogo Guardar o Guardar archivo como.
Puede especificar una ruta de archivo absoluta o relativa, o navegar a una carpeta diferente, para guardar, anexar o sobrescribir los resultados en una ubicación distinta a la ubicación del proyecto. Por ejemplo:
C:\Resultados\Salida.fil o Resultados\Salida.fil.
Nota
Los nombres de las tablas de Analytics tienen un límite de 64 caracteres alfanuméricos, sin incluir la extensión .FIL. El nombre puede incluir un guión bajo ( _ ), pero no puede incluir ningún otro carácter especial ni espacios. El nombre no puede comenzar con un número.
Local Solo está habilitado cuando se está conectado a una tabla de servidores y se están guardando, anexando o sobrescribiendo los resultados en una tabla de Analytics.
-
Seleccionar Local Guarda, anexa o sobrescribe los resultados en la misma ubicación que el proyecto de Analytics.Analytics
-
Dejar Local sin seleccionar Guarda, anexa o sobrescribe los resultados en la carpeta Prefijo en un servidor.
Nota
Para los resultados de salida obtenidos a partir del análisis o el procesamiento de las tablas de Servidor de AX, seleccione Local. No puede quitar la selección de la configuración Local para importar tablas de resultados al Servidor de AX.
-
- Opcional. Especifique un encabezado o un pie de página en el cuadro de texto que corresponda.
Haga clic en Encabezado o en Pie de página para introducir un encabezado o un pie de página de más de una línea. También puede introducir un punto y coma (;) como carácter de interrupción de línea en el cuadro de texto de encabezado o pie de página.
Los encabezados y pies de página están centrados como opción predeterminada. Escriba un corchete de ángulo izquierdo (<) antes del texto de encabezado o pie de página para alinear el texto hacia la izquierda. La alineación hacia la izquierda de múltiples líneas exige un corchete de ángulo izquierdo al comienzo de cada línea.
Nota
En algunos tipos de salida, la opción para especificar un encabezado o un pie de página no está disponible.
Especificar el alcance de la operación
- Haga clic en la ficha Propiedades.
-
En el panel Alcance, seleccione la opción que corresponda:
- Todos/as
- Primeros
- Siguiente
- Mientras
Mostrar más
Opción de alcance Detalles Todos/as (Predeterminado) Especifica que se procesen todos los registros de la vista. Primeros Ingrese un número en el cuadro de texto. Inicia el procesamiento en el primer registro de la vista e incluye solo el número de registros especificado. Siguiente Ingrese un número en el cuadro de texto. Inicia el procesamiento en el registro seleccionado actualmente en la vista e incluye solo el número de registros especificado. El número real de registros debe seleccionarse en la columna ubicada en el extremo izquierdo de la vista, no en los datos de la fila. Mientras Utilice un enunciado WHILE para limitar el procesamiento de registros en la vista basándose en un criterio o un conjunto de criterios.
Ingrese una condición en el cuadro de texto While o haga clic en While para crear un enunciado WHILE con el Generador de expresiones.
Un enunciado WHILE permite que los registros en la vista principal sean procesados sólo mientras la condición especificada se evalúe como verdadera. Tan pronto como la condición se evalúa como falsa, el procesamiento termina, y no se consideran más registros.
Puede utilizar la opción Mientras junto con las opciones Todos, Primero o Siguiente. El procesamiento de registros se detiene en cuanto se alcanza un límite.
Nota
Las opciones Primero o Siguiente hacen referencia al orden físico o al orden indexado de los registros en una tabla. Primero o Siguiente ignoran cualquier filtrado u ordenación rápida que se aplique a una vista de tabla. Sin embargo, los resultados de salida de las operaciones analíticas respetan cualquier filtrado.
Si a una vista se aplica ordenación rápida, Siguiente se comporta como Primero.
Finalizar la configuración y enviar los resultados
-
Opcional. Si seleccionó Archivo como el tipo de salida y desea anexar los resultados de salida al final de una tabla o un archivo existentes, realice cualquiera de las opciones siguientes:
-
Seleccione Anexar al archivo existente si está seguro de que los resultados de la salida y la tabla o el archivo existentes tienen una estructura idéntica.
Al seleccionar Anexar al archivo existente, los resultados se anexan incluso si las longitudes de los registros de los resultados de salida y la tabla o el archivo existentes son diferentes. Si las longitudes de los registros son diferentes, la estructura de datos no es idéntica, y la operación de anexar no se podrá realizar correctamente.
-
Deje Anexar al archivo existente sin seleccionar si desea que Analytics compare las longitudes de los registros de los resultados de salida con una tabla existente. Esta comprobación automática está disponible solamente para tablas de Analytics, no para archivos de texto.
Nota
Deje Anexar a archivo existente sin seleccionar si no está seguro de que los resultados de la salida y la tabla existente tengan una estructura de datos idéntica. Si desea más información acerca de la anexión y la estructura de datos, consulte Anexión de resultados de la salida a una tabla existente.
-
-
Si seleccionó Archivo (Tabla de Analytics) como el tipo de salida, seleccione Utilizar tabla de salida si desea que la tabla de salida se abra automáticamente al finalizar la operación.
- Haga clic en Aceptar.
En los resultados de salida, solo se muestran los registros o los valores duplicados, y no la instancia inicial de un valor o un registro, si usted completa los dos pasos que se indican a continuación:
- Enviar los resultados a la pantalla o a un archivo de texto
- Incluya únicamente los campos probados en los resultados de salida y no seleccione ningún otro campo
Si envía la salida a la pantalla, puede hacer clic en cualquier valor para ver la instancia inicial de un valor o un registro junto con los duplicados.
- Si aparece el mensaje de sobrescritura, seleccione la opción adecuada.
Si espera que aparezca la opción Anexar, pero esta no aparece, haga clic en No para cancelar la operación y consulte Anexión de resultados de la salida a una tabla existente.
Quitar duplicados
Puede utilizar la operación de resumen para quitar registros o valores duplicados de un conjunto de datos y guardar los registros o valores únicos restantes en una nueva tabla de Analytics.

Seleccionar los campos
- En el navegador, abra la tabla de la cual desea quitar los duplicados.
- Seleccione Analizar > Resumir.
- En la ficha Principal, realice una de las siguientes acciones:
- Seleccione el o los campos que pueden contener valores duplicados de la lista Resumir sobre.
- Haga clic en Resumir sobre para seleccionar el campo o los campos, o para crear una expresión.
El orden en que seleccione los campos es el orden en el cual aparecen las columnas en los resultados.
Nota
Seleccione los campos adecuados para lograr el grado deseado de exclusividad.
Por ejemplo, si desea quitar registros de empleados duplicados y selecciona únicamente el campo de apellido, corre el riesgo de eliminar todos los registros de los empleados que tienen el mismo apellido pero un nombre diferente. Seleccione tanto el campo de nombre como el de apellido para aumentar el nivel de exclusividad.
Para quitar solo los registros duplicados exactos, haga clic en Resumir sobre y Agregar todos.
- No seleccione Campos de Subtotal.
- Opcional. Realice una de las siguientes acciones:
- Desde la lista Otros campos, seleccione el o los otros campos para incluirlos en los resultados de la salida.
- Haga clic en Otros campos para seleccionar el campo o los campos, o para crear una expresión.
Nota
Seleccione únicamente campos que contengan el mismo valor para todos los registros de cada grupo resumido. Si desea obtener más información, consulte La opción Otros campos.
Quitar la selección de Preordenar (opcional)
-
Si el campo que puede contener valores duplicados ya está ordenado, no seleccione Preordenar.
Si los datos del campo no están ordenados, debe dejar Preordenar seleccionado para asegurar resultados válidos.
Excluir registros del procesamiento (opcional)
-
Si hay registros en la vista actual que desea excluir del procesamiento, elija una de las siguientes opciones:
-
Ingrese una condición en el cuadro de texto Si
-
Haga clic en Si para crear un enunciado IF utilizando el Generador de expresiones
La condición Si considera todos los registros de la vista principal y filtra los que no cumplen la condición especificada.
Nota
La condición Si se evalúa únicamente con los registros que quedan en una tabla después de aplicar las opciones de alcance (Primeros, Siguientes y Mientras).
-
Configurar la salida
- Haga clic en la ficha Salida.
- En el panel En, seleccione Archivo.
- Especifique la siguiente información en el panel Como:
Tipo de archivo – Tabla Analytics es la única opción. Guarda los resultados en una nueva tabla de Analytics o anexa los resultados en una tabla Analytics existente.
Nombre - Escriba un nombre de tabla en el cuadro de texto Nombre. O haga clic en Nombre e introduzca el nombre del archivo, o seleccione un archivo existente en el cuadro de diálogo Guardar o Guardar archivo como para sobrescribir o anexar a la tabla. Si Analytics pre-completa un nombre de tabla, puede aceptar el nombre pre-completado o cambiarlo.
También puede especificar una ruta de acceso absoluta o relativa, o navegar a una carpeta diferente, para guardar o anexar la tabla en un lugar distinto al lugar de la ubicación del proyecto. Por ejemplo:
C:\Results\No_duplicates.fil o Results\No_duplicates.fil.
Local – Sólo está habilitada cuando se está conectado a una tabla de servidores. Seleccione Local para guardar la tabla de salida en la misma ubicación del proyecto, o para especificar una ruta de acceso o navegar a una carpeta local diferente. Deje Local sin seleccionar para guardar la tabla de salida en la carpeta Prefijo en el servidor Analytics.
Nota
Para los resultados de salida obtenidos a partir del análisis o el procesamiento de las tablas del servidor Analytics Exchange, seleccione Local. No puede utilizar la configuración Local para importar tablas de resultados al Servidor de AX.
Especificar el alcance de la operación
- Haga clic en la ficha Propiedades.
-
En el panel Alcance, seleccione la opción que corresponda:
- Todos/as
- Primeros
- Siguiente
- Mientras
Mostrar más
Opción de alcance Detalles Todos/as (Predeterminado) Especifica que se procesen todos los registros de la vista. Primeros Ingrese un número en el cuadro de texto. Inicia el procesamiento en el primer registro de la vista e incluye solo el número de registros especificado. Siguiente Ingrese un número en el cuadro de texto. Inicia el procesamiento en el registro seleccionado actualmente en la vista e incluye solo el número de registros especificado. El número real de registros debe seleccionarse en la columna ubicada en el extremo izquierdo de la vista, no en los datos de la fila. Mientras Utilice un enunciado WHILE para limitar el procesamiento de registros en la vista basándose en un criterio o un conjunto de criterios.
Ingrese una condición en el cuadro de texto While o haga clic en While para crear un enunciado WHILE con el Generador de expresiones.
Un enunciado WHILE permite que los registros en la vista principal sean procesados sólo mientras la condición especificada se evalúe como verdadera. Tan pronto como la condición se evalúa como falsa, el procesamiento termina, y no se consideran más registros.
Puede utilizar la opción Mientras junto con las opciones Todos, Primero o Siguiente. El procesamiento de registros se detiene en cuanto se alcanza un límite.
Nota
Las opciones Primero o Siguiente hacen referencia al orden físico o al orden indexado de los registros en una tabla. Primero o Siguiente ignoran cualquier filtrado u ordenación rápida que se aplique a una vista de tabla. Sin embargo, los resultados de salida de las operaciones analíticas respetan cualquier filtrado.
Si a una vista se aplica ordenación rápida, Siguiente se comporta como Primero.
Finalizar la configuración y enviar los resultados
-
Seleccione Utilizar la tabla de salida si desea que la tabla de salida se abra automáticamente al finalizar la operación.
- Si desea anexar los resultados de salida al final de una tabla existente de Analytics, realice una de las siguientes acciones:
Seleccione Anexar a un archivo existente si está seguro de que los resultados de salida y la tabla existente son idénticos en estructura.
Deje Anexar al archivo existente sin seleccionar si desea que Analytics compare las longitudes de los registros de los resultados de salida y la tabla existente. Si las longitudes de los registros no son idénticas, la estructura de datos no es idéntica, y la operación de anexar no se podrá realizar correctamente.
Nota
Se recomienda dejar Anexar a archivo existente sin seleccionar si no está seguro de que los resultados de la salida y la tabla existente tengan una estructura de datos idéntica. Si desea más información acerca de la anexión y la estructura de datos, consulte Anexión de resultados de la salida a una tabla existente.
- Haga clic en Aceptar.
- Si aparece el mensaje de sobrescritura, seleccione la opción adecuada.
Si espera que aparezca la opción Anexar, pero esta no aparece, haga clic en No para cancelar la operación y consulte Anexión de resultados de la salida a una tabla existente.