Comando CLUSTER

Agrupa los registros en clústeres según los valores similares en uno o más campos numéricos. Los clústeres pueden ser unidimensionales multidimensionales.

Sintaxis

CLUSTER ON campo_clave <...n> KVALUE número_de_clústeres ITERATIONS número_de_iteraciones INITIALIZATIONS número_de_inicializaciones <SEED valor_semilla> <OTHER campo < ...n>> TO nombre_tabla <IF prueba> <WHILE prueba> <FIRST rango|NEXT rango> OPEN {sin_palabra_clave|NOCENTER|NOSCALE}

Parámetros

Nombre	Descripción
ON campo_clave <...n>	Uno o más campos numéricos a agrupar. Múltiples campos se deben separar con espacios.
KVALUE número_de_clústeres	La cantidad de clústeres generados en los resultados de salida.
ITERATIONS número_de_iteraciones	La cantidad máxima de veces que se vuelve a realizar el cálculo de clústeres.
INITIALIZATIONS número_de_inicializaciones	La cantidad de veces que se debe generar un conjunto inicial de centroides aleatorios.
SEED valor_semilla opcional	El valor semilla que se debe usar para inicializar el generador de números aleatorios en Analytics. Si omite SEED, Analytics selecciona de manera aleatoria el valor semilla.
OTHER campo <...n> opcional	Uno o más campos adicionales para incluir en la salida. Nota Los campos clave se incluyen automáticamente en la tabla de salida y no es necesario especificarlos usando OTHER.
TO nombre_tabla	El lugar al que se deben enviar los resultados del comando: nombre_tabla guarda los resultados en una tabla de Analytics Especifique el nombre_tabla como una cadena entre comillas con la extensión de archivo .FIL. Por ejemplo: TO "Salida.FIL" Por valor predeterminado, el archivo de datos de la tabla (.FIL) se guarda en la carpeta que contiene el proyecto de Analytics. Utilice una ruta de archivo absoluta o relativa para guardar el archivo de datos en una carpeta existente o una diferente: TO "C:\Salida.FIL" TO "Resultados\Salida.FIL" Nota Los nombres de las tablas tienen un límite de 64 caracteres alfanuméricos, sin incluir la extensión .FIL. El nombre puede incluir un guión bajo ( _ ), pero no puede incluir ningún otro carácter especial ni espacios. El nombre no puede comenzar con un número.
IF prueba opcional	Una expresión condicional que debe ser verdadera para procesar cada registro. El comando se ejecuta únicamente en los registros que cumplen la condición. Nota El parámetro IF se evalúa únicamente con los registros que quedan en la tabla después de aplicar los parámetros de alcance (WHILE, FIRST, NEXT).
WHILE prueba opcional	Una expresión condicional que debe ser verdadera para procesar cada registro. El comando se ejecuta hasta que la condición se evalúa como falsa o hasta que se llega al final de la tabla. Nota Si usa WHILE junto con FIRST o NEXT, el procesamiento de registros se detiene al llegar a un límite.
FIRST rango \| NEXT rango opcional	La cantidad de registros que se procesarán: FIRST comienza a procesar desde el primer registro hasta que se llega al número de registros especificado NEXT comienza a procesar desde el registro seleccionado actualmente hasta que se llega al número de registros especificado Utilice intervalo para especificar la cantidad de registros que se deben procesar. Si omite FIRST y NEXT, se procesan todos los registros de forma predeterminada.
OPEN opcional	Abre la tabla creada por el comando después de la ejecución del comando. Solo es válido si el comando crea una tabla de salida.
sin_palabra_clave \| NOCENTER \| NOSCALE	El método para estandarizar los valores numéricos de campos clave. sin_palabra_clave centrar los valores de campos clave alrededor del cero (0) y escalar los valores a la varianza de unidad al calcular los clústeres NOCENTER escalar los valores de campo clave a la varianza de unidad al calcular los clústeres, pero sin centrar los valores alrededor del cero (0) NOSCALE usar los valores de campo clave sin procesar, sin escalar, al calcular los clústeres

Ejemplos

Agrupación en clústeres por importe de factura

Además de estratificar una tabla de cuentas por cobrar por el campo Importe_factura, también puede decidir agrupar por el mismo campo.

La estratificación agrupa los importes en estratos con límites numéricos predefinidos; por ejemplo, intervalos de $1000.
La agrupación en clústeres descubre los agrupamientos orgánicos de importes que existen en los datos sin que usted tenga que decidir límites numéricos por anticipado.

OPEN Ar
CLUSTER ON Importe_factura KVALUE 8 ITERATIONS 30 INITIALIZATIONS 10 OTHER Tipo Ref Sin Vencimiento TO "Facturas_agrupadas" NOSCALE

Como una forma rápida de descubrir cuántos registros hay en cada clúster de salida, usted clasifica la tabla de salida Facturas_agrupadas por el campo Clúster.

OPEN Facturas_agrupadas
CLASSIFY ON Clúster TO SCREEN

Observaciones

Nota

Si desea obtener más información sobre la forma en la que funciona este comando, consulte Guía de ayuda.

[ Volver al inicio ]

Guía de creación de scripts de ACL 14.1