Comparación de métodos de combinación de datos

Las ventajas y desventajas de los métodos de combinación de datos en Analytics se detallan a continuación.

Nota

La anexión, la extracción y anexión, y la fusión se comparan porque son métodos de combinación de tablas con estructuras de registros idénticas o similares.

Unir se compara con relacionar porque estos dos métodos combinan tablas con diferentes estructuras de registros.

Si desea obtener más información, consulte Requisitos de estructura de datos y formato de datos.

Anexión, extracción y anexión, y fusión

Requisito/capacidad

Anexión

Extracción y anexión

Combinar

Las tablas que se están combinando deben tener una estructura de datos idéntica No

La tabla combinada resultante no se ordena.

No

Los registros extraídos de las tablas de origen se anexan como grupos en la tabla de salida.

No

Los registros extraídos de la tabla de origen se anexan como un grupo al final de la tabla de destino.

Los registros de ambas tablas se insertaron en una nueva tabla en base al orden.

Acceder y analizar datos de dos tablas

Acceder y analizar datos de más de dos tablas

No se admite en una sola operación de extracción y anexión. Se necesitan varias operaciones.

No se admite en una sola operación de fusión. Se necesitan varias operaciones.

Envía los resultados de la salida a una nueva tabla Analytics físicamente separada

No

Los campos clave en ambas tablas deben ser:

  • ordenadas
  • del mismo tipo de datos
  • de la misma longitud

No aplicable

La anexión no usa campos clave.

No aplicable

La extracción y anexión no usa campos clave.

Número de campos clave

No aplicable

La anexión no usa campos clave.

No aplicable

La extracción y anexión no usa campos clave.

Es posible seleccionar uno o más campos clave de cada tabla.

Unión y relación

Nota

Si las tablas que desea combinar tienen estructuras de registro idénticas, probablemente debería utilizar la anexión, la extracción y anexión, o la fusión.

Comparación de las capacidades

Capacidad

Unir

Relacionar

Caso de uso Es bueno como paso preliminar para trabajo investigativo porque su salida es una nueva tabla unida permanentemente. Es bueno para los trabajos informativos porque se crea una tabla virtual sin ningún requisito de que se vuelva permanente.

Acceder y analizar datos desde dos tablas de manera simultánea

Acceder y analizar datos de más de dos tablas de manera simultánea

No

No se admite en una sola operación de unión. Se necesitan varias operaciones de unión.

Una sola operación de relación admite el acceso y el análisis de hasta 18 tablas de manera simultánea.

Envía los resultados de la salida a una nueva tabla Analytics físicamente separada

No

Si es necesario, puede realizar una operación independiente y extraer cualquier combinación de campos a partir de las tablas relacionadas a una tabla nueva.

Número de campos clave

Es posible seleccionar uno o más campos clave de cada tabla.

Limitado a un campo clave por par de tablas

Si es necesario más de un campo clave para establecer una relación precisa entre un par de tablas, cree un campo calculado en cada tabla para concatenar los campos clave necesarios.

Velocidad de ejecución de la operación

Más lento

La duración de la operación de unión varía según la complejidad de la unión y depende del hecho de que la tabla primaria esté o no esté ordenada.

Más rápido

No se realiza ninguna correspondencia de registros real durante la operación de relación. Por eso es que lleva bastante menos tiempo que la operación de unión.

Procesamiento posterior de un archivo

Más rápido

Los resultados de la unión se ordenan en un archivo plano (archivo de datos de origen .fil). Los archivos planos se pueden procesar muy rápidamente.

Más lento

La correspondencia de registros entre las tablas relacionadas se realiza durante el procesamiento posterior y esto incrementa el tiempo de procesamiento.

Se puede actualizar a partir de los archivos de datos originales

No

Los resultados de la unión se envían a una nueva tercera tabla con un nuevo archivo de datos de origen que ya no está asociado con los archivos de datos de origen que se utilizaron en la unión.

Las tablas relacionadas continúan asociadas con los archivos de datos de origen utilizados en la relación y es posible actualizarlas a partir de ellos.

Registros primarios y secundarios con correspondencia

(1ra correspondencia secundaria)

No se admite directamente

Después de relacionar las tablas, utilice filtros para aislar los registros primarios que cuenten con registros secundarios coincidentes.

Registros primarios y secundarios con correspondencia

(todas las correspondencias secundarias)

También se denomina correspondencia de muchos a muchos

No

Registros principales no coincidentes

No se admite directamente

Después de relacionar las tablas, utilice filtros para aislar los registros primarios que no cuenten con registros secundarios coincidentes.

Todos los registros primarios y los registros secundarios que coinciden

Todos los registros secundarios y los registros primarios que coinciden

No

Todos los registros primarios y secundarios, que coinciden y no coinciden

No

Comparación de los requisitos

Requisito

Unir

Relacionar

Las tablas que se están combinando deben tener una estructura de datos idéntica No No

Los tipos de datos del campo clave deben ser idénticos para cada par de tablas

Varía

No es necesario para las uniones de carácter y numéricas o numéricas y de carácter. Analytics las unifica automáticamente. Obligatorio para el resto de las posibilidades.

Las longitudes del campo clave deben ser idénticas para cada par de tablas

Recomendado (no es obligatorio)

Analytics unifica automáticamente las longitudes de los dos campos clave de caracteres.

Recomendado (no es obligatorio)

Se requiere espacio en el disco para el procesamiento

Más

La unión crea una nueva tercera tabla que puede ser más grande que las dos tablas originales combinadas, según la naturaleza de la unión.

Menos

Se necesita poco espacio en disco para crear un índice para las tablas relacionadas.

Las tablas se deben ordenar o indexar

Se necesita Ordenar, Preordenar o Indexar la tabla secundaria y esto es opcional para la tabla primaria.

Se necesita indexar las tablas relacionadas (se crean automáticamente al relacionar tablas), Ordenar o Indexar es opcional para la tabla primaria.

Ayuda de Analytics 14.1