Comando CLUSTER

Agrupa los registros en clústeres según los valores similares en uno o más campos numéricos. Los clústeres pueden ser unidimensionales multidimensionales.

Sintaxis

CLUSTER ON campo_clave <...n> KVALUE número_de_clústeres ITERATIONS número_de_iteraciones INITIALIZATIONS número_de_inicializaciones <SEED valor_semilla> <OTHER campo < ...n>> TO nombre_tabla <IF prueba> <WHILE prueba> <FIRST rango|NEXT rango> OPEN {sin_palabra_clave|NOCENTER|NOSCALE}

Parámetros

Nombre Descripción
ON campo_clave <...n>

Uno o más campos numéricos a agrupar. Múltiples campos se deben separar con espacios.

KVALUE número_de_clústeres La cantidad de clústeres generados en los resultados de salida.
ITERATIONS número_de_iteraciones La cantidad máxima de veces que se vuelve a realizar el cálculo de clústeres.
INITIALIZATIONS número_de_inicializaciones

La cantidad de veces que se debe generar un conjunto inicial de centroides aleatorios.

SEED valor_semilla

opcional

El valor semilla que se debe usar para inicializar el generador de números aleatorios en Analytics.

Si omite SEED, Analytics selecciona de manera aleatoria el valor semilla.

OTHER campo <...n>

opcional

Uno o más campos adicionales para incluir en la salida.

Nota

Los campos clave se incluyen automáticamente en la tabla de salida y no es necesario especificarlos usando OTHER.

TO nombre_tabla

El lugar al que se deben enviar los resultados del comando:

  • nombre_tabla guarda los resultados en una tabla de Analytics

    Especifique el nombre_tabla como una cadena entre comillas con la extensión de archivo .FIL. Por ejemplo: TO "Salida.FIL"

    Por valor predeterminado, el archivo de datos de la tabla (.FIL) se guarda en la carpeta que contiene el proyecto de Analytics.

    Utilice una ruta de archivo absoluta o relativa para guardar el archivo de datos en una carpeta existente o una diferente:

    • TO "C:\Salida.FIL"
    • TO "Resultados\Salida.FIL"

    Nota

    Los nombres de las tablas tienen un límite de 64 caracteres alfanuméricos, sin incluir la extensión .FIL. El nombre puede incluir un guión bajo ( _ ), pero no puede incluir ningún otro carácter especial ni espacios. El nombre no puede comenzar con un número.

IF prueba

opcional

Una expresión condicional que debe ser verdadera para procesar cada registro. El comando se ejecuta únicamente en los registros que cumplen la condición.

Nota

El parámetro IF se evalúa únicamente con los registros que quedan en la tabla después de aplicar los parámetros de alcance (WHILE, FIRST, NEXT).

WHILE prueba

opcional

Una expresión condicional que debe ser verdadera para procesar cada registro. El comando se ejecuta hasta que la condición se evalúa como falsa o hasta que se llega al final de la tabla.

Nota

Si usa WHILE junto con FIRST o NEXT, el procesamiento de registros se detiene al llegar a un límite.

FIRST rango | NEXT rango

opcional

La cantidad de registros que se procesarán:

  • FIRST comienza a procesar desde el primer registro hasta que se llega al número de registros especificado
  • NEXT comienza a procesar desde el registro seleccionado actualmente hasta que se llega al número de registros especificado

Utilice intervalo para especificar la cantidad de registros que se deben procesar.

Si omite FIRST y NEXT, se procesan todos los registros de forma predeterminada.

OPEN

opcional

Abre la tabla creada por el comando después de la ejecución del comando. Solo es válido si el comando crea una tabla de salida.

sin_palabra_clave | NOCENTER | NOSCALE

El método para estandarizar los valores numéricos de campos clave.

  • sin_palabra_clave centrar los valores de campos clave alrededor del cero (0) y escalar los valores a la varianza de unidad al calcular los clústeres
  • NOCENTER escalar los valores de campo clave a la varianza de unidad al calcular los clústeres, pero sin centrar los valores alrededor del cero (0)
  • NOSCALE usar los valores de campo clave sin procesar, sin escalar, al calcular los clústeres

Ejemplos

Agrupación en clústeres por importe de factura

Además de estratificar una tabla de cuentas por cobrar por el campo Importe_factura, también puede decidir agrupar por el mismo campo.

  • La estratificación agrupa los importes en estratos con límites numéricos predefinidos; por ejemplo, intervalos de $1000.
  • La agrupación en clústeres descubre los agrupamientos orgánicos de importes que existen en los datos sin que usted tenga que decidir límites numéricos por anticipado.
OPEN Ar
CLUSTER ON Importe_factura KVALUE 8 ITERATIONS 30 INITIALIZATIONS 10 OTHER Tipo Ref Sin Vencimiento TO "Facturas_agrupadas" NOSCALE

Como una forma rápida de descubrir cuántos registros hay en cada clúster de salida, usted clasifica la tabla de salida Facturas_agrupadas por el campo Clúster.

OPEN Facturas_agrupadas
CLASSIFY ON Clúster TO SCREEN

Observaciones

Nota

Si desea obtener más información sobre la forma en la que funciona este comando, consulte Guía de ayuda.

Guía de creación de scripts de ACL 14.1