Comando CLUSTER
Agrupa los registros en clústeres según los valores similares en uno o más campos numéricos. Los clústeres pueden ser unidimensionales multidimensionales.
Sintaxis
CLUSTER ON campo_clave <...n> KVALUE número_de_clústeres ITERATIONS número_de_iteraciones INITIALIZATIONS número_de_inicializaciones <SEED valor_semilla> <OTHER campo < ...n>> TO nombre_tabla <IF prueba> <WHILE prueba> <FIRST rango|NEXT rango> OPEN {sin_palabra_clave|NOCENTER|NOSCALE}
Parámetros
Nombre | Descripción |
---|---|
ON campo_clave <...n> |
Uno o más campos numéricos a agrupar. Múltiples campos se deben separar con espacios. |
KVALUE número_de_clústeres | La cantidad de clústeres generados en los resultados de salida. |
ITERATIONS número_de_iteraciones | La cantidad máxima de veces que se vuelve a realizar el cálculo de clústeres. |
INITIALIZATIONS número_de_inicializaciones |
La cantidad de veces que se debe generar un conjunto inicial de centroides aleatorios. |
SEED valor_semilla opcional |
El valor semilla que se debe usar para inicializar el generador de números aleatorios en Analytics. Si omite SEED, Analytics selecciona de manera aleatoria el valor semilla. |
OTHER campo <...n> opcional |
Uno o más campos adicionales para incluir en la salida. Nota Los campos clave se incluyen automáticamente en la tabla de salida y no es necesario especificarlos usando OTHER. |
TO nombre_tabla |
El lugar al que se deben enviar los resultados del comando:
|
IF prueba opcional |
Una expresión condicional que debe ser verdadera para procesar cada registro. El comando se ejecuta únicamente en los registros que cumplen la condición. Nota El parámetro IF se evalúa únicamente con los registros que quedan en la tabla después de aplicar los parámetros de alcance (WHILE, FIRST, NEXT). |
WHILE prueba opcional |
Una expresión condicional que debe ser verdadera para procesar cada registro. El comando se ejecuta hasta que la condición se evalúa como falsa o hasta que se llega al final de la tabla. Nota Si usa WHILE junto con FIRST o NEXT, el procesamiento de registros se detiene al llegar a un límite. |
FIRST rango | NEXT rango opcional |
La cantidad de registros que se procesarán:
Utilice intervalo para especificar la cantidad de registros que se deben procesar. Si omite FIRST y NEXT, se procesan todos los registros de forma predeterminada. |
OPEN opcional |
Abre la tabla creada por el comando después de la ejecución del comando. Solo es válido si el comando crea una tabla de salida. |
sin_palabra_clave | NOCENTER | NOSCALE |
El método para estandarizar los valores numéricos de campos clave.
|
Ejemplos
Agrupación en clústeres por importe de factura
Además de estratificar una tabla de cuentas por cobrar por el campo Importe_factura, también puede decidir agrupar por el mismo campo.
- La estratificación agrupa los importes en estratos con límites numéricos predefinidos; por ejemplo, intervalos de $1000.
- La agrupación en clústeres descubre los agrupamientos orgánicos de importes que existen en los datos sin que usted tenga que decidir límites numéricos por anticipado.
OPEN Ar CLUSTER ON Importe_factura KVALUE 8 ITERATIONS 30 INITIALIZATIONS 10 OTHER Tipo Ref Sin Vencimiento TO "Facturas_agrupadas" NOSCALE
Como una forma rápida de descubrir cuántos registros hay en cada clúster de salida, usted clasifica la tabla de salida Facturas_agrupadas por el campo Clúster.
OPEN Facturas_agrupadas CLASSIFY ON Clúster TO SCREEN
Observaciones
Nota
Si desea obtener más información sobre la forma en la que funciona este comando, consulte Guía de ayuda.