Comparación de métodos de combinación de datos
Las ventajas y desventajas de los métodos de combinación de datos en Analytics se detallan a continuación.
Nota
La anexión, la extracción y anexión, y la fusión se comparan porque son métodos de combinación de tablas con estructuras de registros idénticas o similares.
Unir se compara con relacionar porque estos dos métodos combinan tablas con diferentes estructuras de registros.
Si desea obtener más información, consulte Requisitos de estructura de datos y formato de datos.
Anexión, extracción y anexión, y fusión
|
Requisito/capacidad |
Anexión |
Extracción y anexión |
Combinar |
|---|---|---|---|
| Las tablas que se están combinando deben tener una estructura de datos idéntica | No |
Sí |
Sí |
| La tabla combinada resultante no se ordena. |
No Los registros extraídos de las tablas de origen se anexan como grupos en la tabla de salida. |
No Los registros extraídos de la tabla de origen se anexan como un grupo al final de la tabla de destino. |
Sí Los registros de ambas tablas se insertaron en una nueva tabla en base al orden. |
|
Acceder y analizar datos de dos tablas |
Sí |
Sí |
Sí |
|
Acceder y analizar datos de más de dos tablas |
Sí |
No se admite en una sola operación de extracción y anexión. Se necesitan varias operaciones. |
No se admite en una sola operación de fusión. Se necesitan varias operaciones. |
|
Envía los resultados de la salida a una nueva tabla Analytics físicamente separada |
Sí |
No |
Sí |
|
Los campos clave en ambas tablas deben ser:
|
No aplicable La anexión no usa campos clave. |
No aplicable La extracción y anexión no usa campos clave. |
Sí |
|
Número de campos clave |
No aplicable La anexión no usa campos clave. |
No aplicable La extracción y anexión no usa campos clave. |
Es posible seleccionar uno o más campos clave de cada tabla. |
Unión y relación
Nota
Si las tablas que desea combinar tienen estructuras de registro idénticas, probablemente debería utilizar la anexión, la extracción y anexión, o la fusión.
Comparación de las capacidades
|
Capacidad |
Unir |
Relacionar |
|---|---|---|
| Caso de uso | Es bueno como paso preliminar para trabajo investigativo porque su salida es una nueva tabla unida permanentemente. | Es bueno para los trabajos informativos porque se crea una tabla virtual sin ningún requisito de que se vuelva permanente. |
|
Acceder y analizar datos desde dos tablas de manera simultánea |
Sí |
Sí |
|
Acceder y analizar datos de más de dos tablas de manera simultánea |
No No se admite en una sola operación de unión. Se necesitan varias operaciones de unión. |
Sí Una sola operación de relación admite el acceso y el análisis de hasta 18 tablas de manera simultánea. |
|
Envía los resultados de la salida a una nueva tabla Analytics físicamente separada |
Sí |
No Si es necesario, puede realizar una operación independiente y extraer cualquier combinación de campos a partir de las tablas relacionadas a una tabla nueva. |
|
Número de campos clave |
Es posible seleccionar uno o más campos clave de cada tabla. |
Limitado a un campo clave por par de tablas Si es necesario más de un campo clave para establecer una relación precisa entre un par de tablas, cree un campo calculado en cada tabla para concatenar los campos clave necesarios. |
|
Velocidad de ejecución de la operación |
Más lento La duración de la operación de unión varía según la complejidad de la unión y depende del hecho de que la tabla primaria esté o no esté ordenada. |
Más rápido No se realiza ninguna correspondencia de registros real durante la operación de relación. Por eso es que lleva bastante menos tiempo que la operación de unión. |
|
Procesamiento posterior de un archivo |
Más rápido Los resultados de la unión se ordenan en un archivo plano (archivo de datos de origen .fil). Los archivos planos se pueden procesar muy rápidamente. |
Más lento La correspondencia de registros entre las tablas relacionadas se realiza durante el procesamiento posterior y esto incrementa el tiempo de procesamiento. |
|
Se puede actualizar a partir de los archivos de datos originales |
No Los resultados de la unión se envían a una nueva tercera tabla con un nuevo archivo de datos de origen que ya no está asociado con los archivos de datos de origen que se utilizaron en la unión. |
Sí Las tablas relacionadas continúan asociadas con los archivos de datos de origen utilizados en la relación y es posible actualizarlas a partir de ellos. |
|
Registros primarios y secundarios con correspondencia (1ra correspondencia secundaria) |
Sí |
No se admite directamente Después de relacionar las tablas, utilice filtros para aislar los registros primarios que cuenten con registros secundarios coincidentes. |
|
Registros primarios y secundarios con correspondencia (todas las correspondencias secundarias) También se denomina correspondencia de muchos a muchos |
Sí |
No |
|
Registros principales no coincidentes |
Sí |
No se admite directamente Después de relacionar las tablas, utilice filtros para aislar los registros primarios que no cuenten con registros secundarios coincidentes. |
|
Todos los registros primarios y los registros secundarios que coinciden |
Sí |
Sí |
|
Todos los registros secundarios y los registros primarios que coinciden |
Sí |
No |
|
Todos los registros primarios y secundarios, que coinciden y no coinciden |
Sí |
No |
Comparación de los requisitos
|
Requisito |
Unir |
Relacionar |
|---|---|---|
| Las tablas que se están combinando deben tener una estructura de datos idéntica | No | No |
|
Los tipos de datos del campo clave deben ser idénticos para cada par de tablas |
Varía No es necesario para las uniones de carácter y numéricas o numéricas y de carácter. Analytics las unifica automáticamente. Obligatorio para el resto de las posibilidades. |
Sí |
|
Las longitudes del campo clave deben ser idénticas para cada par de tablas |
Recomendado (no es obligatorio) Analytics unifica automáticamente las longitudes de los dos campos clave de caracteres. |
Recomendado (no es obligatorio) |
|
Se requiere espacio en el disco para el procesamiento |
Más La unión crea una nueva tercera tabla que puede ser más grande que las dos tablas originales combinadas, según la naturaleza de la unión. |
Menos Se necesita poco espacio en disco para crear un índice para las tablas relacionadas. |
|
Las tablas se deben ordenar o indexar |
Se necesita Ordenar, Preordenar o Indexar la tabla secundaria y esto es opcional para la tabla primaria. |
Se necesita indexar las tablas relacionadas (se crean automáticamente al relacionar tablas), Ordenar o Indexar es opcional para la tabla primaria. |