Ordenación e indexación
La ordenación y la indexación son dos métodos diferentes de ordenar datos de forma secuencial en las tablas. Algunos comandos de Analytics requieren que los datos de entrada primero se ordenen e indexen. La ordenación de datos también puede ser útil para las operaciones analíticas en sí, ya que pone de relieve los patrones y las anomalías.
Operación | Descripción |
---|---|
Ordenación |
La ordenación de una tabla reordena físicamente datos en un orden secuencial y envía los resultados a una nueva tabla de Analytics. |
Indexación |
Indexación no realiza cambios al orden físico subyacente de los datos. En su lugar, crea un archivo de índice independiente que hace referencia a los registros en una tabla activa, permitiendo el acceso a los registros en un orden secuencial en lugar de un orden físico. Los datos de la vista se reordenan de acuerdo con un índice solo mientras el índice está activo. |
Ordenamiento de los datos como prerrequisito para otras operaciones de ACL
Como las computadoras procesan los archivos en secuencia, comenzando por el primer registro, en varias pruebas analíticas y otras operaciones de Analytics es un prerrequisito ordenar los datos de forma secuencial. Las operaciones de múltiples tablas, como las uniones o relaciones, pueden requerir que los campos clave estén ordenados o indexados.
Es posible que otras pruebas y operaciones de Analytics no requieran los datos ordenados, pero se ejecutan mucho más rápido si los datos se ordenan o indexan previamente.
¿Debo ordenar o indexar?
La decisión de ordenar o indexar tal vez dependa de la tarea específica que desee realizar. Por ejemplo:
- Ordenar puede ser una mejor opción para trabajos de investigación, ya que genera una nueva tabla que puede servir como base para su posterior análisis.
- Indexar puede ser una mejor opción para el trabajo informativo o preliminar porque le permite cambiar rápidamente entre diferentes representaciones de los datos en la tabla activa.
Ventajas y desventajas de ordenar e indexar
La siguiente tabla compara las ventajas y desventajas de ordenar e indexar, e indica las operaciones que requieren ordenamiento o indexación como un prerrequisito.
|
Ordenación |
Indexación |
---|---|---|
Envía los resultados de la salida a una nueva tabla Analytics físicamente separada |
Sí |
No |
Reordena físicamente los datos |
Sí |
No |
Velocidad de la operación |
Más lento |
Más rápido |
Se requiere espacio en el disco para el procesamiento |
Más |
Menos |
Tamaño de archivo resultante |
Más grande |
Más pequeño |
Procesamiento posterior del archivo ordenado o indexado |
Más rápido |
Más lento |
Buscando campos de caracteres |
Más lento |
Más rápido |
Prerrequisito para |
|
|
La opción Criterio de ordenamiento y las secuencias de ordenamiento
La opción Criterio de ordenamiento (Herramientas > Opciones > Tabla) especifica la secuencia de ordenamiento (compaginación) para datos de caracteres. La opción que usted especifica define qué secuencia de ordenamiento se utiliza cuando ordene o aplique indexación a registros, o realice pruebas al orden secuencial, utilizando un campo de caracteres.
¿Qué es una secuencia de ordenamiento?
Una secuencia de ordenamiento es como un plantilla con respecto a la cual Analytics compara el primer carácter o caracteres de cada valor en un campo de caracteres al ordenar, indexar, realizar pruebas de orden secuencial o al realizar una ordenación rápida.
La siguiente tabla muestra el Criterio de ordenamiento predeterminado de Analytics y la secuencia de ordenamiento asociada.
Edición de Analytics |
Criterio de ordenamiento predeterminado |
Secuencia de ordenamiento asociada |
---|---|---|
No Unicode |
Sistema predeterminado (ASCII) |
|
Unicode |
Combinar idiomas (UCA) (Algoritmo de compaginación Unicode) |
|
Cambio del criterio de ordenamiento
Puede cambiar el Criterio de ordenamiento a un idioma diferente si coincide mejor con los datos que está analizando. En la edición Unicode de Analytics, también puede realizar este cambio ejecutando comandos mediante el parámetro ISOLOCALE en la línea de comandos o con un script.
Modificación de una secuencia de ordenamiento
En la edición no Unicode de Analytics, cuando selecciona un idioma diferente, tiene la opción de modificar la secuencia de ordenamiento asociada cambiando el orden de los caracteres en el cuadro de texto Criterio de ordenamiento.
También tiene la opción de crear una secuencia de ordenamiento personalizada seleccionando Personalizado en el campo Criterio de ordenamiento y especificando una secuencia, o introduciendo SET ORDER <TO> valores en la línea de comandos o un script y especificando una secuencia. Cualquier carácter que se especifique será ordenado antes de todos los demás caracteres y en la secuencia que usted especifique. Por ejemplo, puede especificar que las letras mayúsculas y minúsculas se entremezclen introduciendo los valores aAbBcC.. Especificar SET ORDER devuelve la secuencia de ordenamiento a su configuración predeterminada.
Secuencia de ordenamiento basada en el orden de byte
La secuencia de ordenamiento predeterminada para idiomas individuales se deriva del orden de los bytes de cada carácter en su conjunto de caracteres. Puede ver el orden en bytes de los caracteres en los conjuntos de caracteres usando el Mapa de caracteres de Windows.