Ordenación e indexación

La ordenación y la indexación son dos métodos diferentes de ordenar datos de forma secuencial en las tablas. Algunos comandos de Analytics requieren que los datos de entrada primero se ordenen e indexen. La ordenación de datos también puede ser útil para las operaciones analíticas en sí, ya que pone de relieve los patrones y las anomalías.

Operación Descripción
Ordenación

La ordenación de una tabla reordena físicamente datos en un orden secuencial y envía los resultados a una nueva tabla de Analytics.

Indexación

Indexación no realiza cambios al orden físico subyacente de los datos. En su lugar, crea un archivo de índice independiente que hace referencia a los registros en una tabla activa, permitiendo el acceso a los registros en un orden secuencial en lugar de un orden físico. Los datos de la vista se reordenan de acuerdo con un índice solo mientras el índice está activo.

Ordenamiento de los datos como prerrequisito para otras operaciones de ACL

Como las computadoras procesan los archivos en secuencia, comenzando por el primer registro, en varias pruebas analíticas y otras operaciones de Analytics es un prerrequisito ordenar los datos de forma secuencial. Las operaciones de múltiples tablas, como las uniones o relaciones, pueden requerir que los campos clave estén ordenados o indexados.

Es posible que otras pruebas y operaciones de Analytics no requieran los datos ordenados, pero se ejecutan mucho más rápido si los datos se ordenan o indexan previamente.

¿Debo ordenar o indexar?

La decisión de ordenar o indexar tal vez dependa de la tarea específica que desee realizar. Por ejemplo:

  • Ordenar puede ser una mejor opción para trabajos de investigación, ya que genera una nueva tabla que puede servir como base para su posterior análisis.
  • Indexar puede ser una mejor opción para el trabajo informativo o preliminar porque le permite cambiar rápidamente entre diferentes representaciones de los datos en la tabla activa.

Ventajas y desventajas de ordenar e indexar

La siguiente tabla compara las ventajas y desventajas de ordenar e indexar, e indica las operaciones que requieren ordenamiento o indexación como un prerrequisito.

 

Ordenación

Indexación

Envía los resultados de la salida a una nueva tabla Analytics físicamente separada

No

Reordena físicamente los datos

No

Velocidad de la operación

Más lento

Más rápido

Se requiere espacio en el disco para el procesamiento

Más

Menos

Tamaño de archivo resultante

Más grande

Más pequeño

Procesamiento posterior del archivo ordenado o indexado

Más rápido

Más lento

Buscando campos de caracteres

Más lento

Más rápido

Prerrequisito para

  • Unir

    (recomendado, pero no obligatorio, para la tabla primaria)

  • Fusionar
  • Duplicados
  • Faltantes
  • Definir relación

    (Analytics realizará de manera automática la indexación del campo clave de la tabla relacionada)

  • Unir

    (sólo se puede aplicar un índice a la tabla secundaria desde la línea de comandos o en un script)

  • Fusionar

    (sólo se puede aplicar un índice a la tabla secundaria desde la línea de comandos o en un script)

  • Duplicados
  • Faltantes
  • Buscar
  • Opción de búsqueda Buscar literal
  • Buscar
  • Opción de búsqueda Hallar expresión

La opción Criterio de ordenamiento y las secuencias de ordenamiento

La opción Criterio de ordenamiento (Herramientas > Opciones > Tabla) especifica la secuencia de ordenamiento (compaginación) para datos de caracteres. La opción que usted especifica define qué secuencia de ordenamiento se utiliza cuando ordene o aplique indexación a registros, o realice pruebas al orden secuencial, utilizando un campo de caracteres.

¿Qué es una secuencia de ordenamiento?

Una secuencia de ordenamiento es como un plantilla con respecto a la cual Analytics compara el primer carácter o caracteres de cada valor en un campo de caracteres al ordenar, indexar, realizar pruebas de orden secuencial o al realizar una ordenación rápida.

La siguiente tabla muestra el Criterio de ordenamiento predeterminado de Analytics y la secuencia de ordenamiento asociada.

Edición de Analytics

Criterio de ordenamiento predeterminado

Secuencia de ordenamiento asociada

No Unicode

Sistema predeterminado

(ASCII)

  • números, luego mayúsculas, luego minúsculas

    0, 1, 2...  A, B, C...  a, b, c...

    Por ejemplo, "Z" se ordena antes de "a".

  • Los caracteres especiales aparecen en diferentes puntos de la secuencia, dependiendo del carácter.

  • Los caracteres con marcas diacríticas aparecen al final de la secuencia y usan las mismas mayúsculas antes de secuencia interna de minúsculas.

Unicode

Combinar idiomas (UCA)

(Algoritmo de compaginación Unicode)

  • números, luego letras minúsculas y mayúsculas entremezcladas

    0, 1, 2...  a, A, b, B, c, C...

    Por ejemplo, "Z" se ordena antes de "a".

  • Los caracteres especiales aparecen antes de los números.

  • Los caracteres con marcas diacríticas se entremezclan con caracteres sin marcas diacríticas.

    Por ejemplo: e, E, é, É, f, F

Cambio del criterio de ordenamiento

Puede cambiar el Criterio de ordenamiento a un idioma diferente si coincide mejor con los datos que está analizando. En la edición Unicode de Analytics, también puede realizar este cambio ejecutando comandos mediante el parámetro ISOLOCALE en la línea de comandos o con un script.

Modificación de una secuencia de ordenamiento

En la edición no Unicode de Analytics, cuando selecciona un idioma diferente, tiene la opción de modificar la secuencia de ordenamiento asociada cambiando el orden de los caracteres en el cuadro de texto Criterio de ordenamiento.

También tiene la opción de crear una secuencia de ordenamiento personalizada seleccionando Personalizado en el campo Criterio de ordenamiento y especificando una secuencia, o introduciendo SET ORDER <TO> valores en la línea de comandos o un script y especificando una secuencia. Cualquier carácter que se especifique será ordenado antes de todos los demás caracteres y en la secuencia que usted especifique. Por ejemplo, puede especificar que las letras mayúsculas y minúsculas se entremezclen introduciendo los valores aAbBcC.. Especificar SET ORDER devuelve la secuencia de ordenamiento a su configuración predeterminada.

Secuencia de ordenamiento basada en el orden de byte

La secuencia de ordenamiento predeterminada para idiomas individuales se deriva del orden de los bytes de cada carácter en su conjunto de caracteres. Puede ver el orden en bytes de los caracteres en los conjuntos de caracteres usando el Mapa de caracteres de Windows.

Ayuda de Analytics 14.1