Commande CLUSTER

Regroupe les enregistrements en clusters selon des valeurs similaires dans un ou plusieurs champs numériques. Les clusters peuvent être unidimensionels ou multidimensionnels.

Syntaxe

CLUSTER ON champ_fclé <...n> KVALUE nombre_de_clusters ITERATIONS nombre_itérations INITIALIZATIONS nombre_initialisations <SEED valeur_départ> <OTHER champ < ...n>> TOnom_table <IF test> <WHILE test> <FIRST plage|NEXT plage> OPEN {aucun_mot_clé|NOCENTER|NOSCALE}

Paramètres

Nom Description
ON champ_clé <...n>

Un ou plusieurs champs numériques à regrouper. Les champs multiples doivent être séparés par des espaces.

KVALUE nombre_de_clusters Nombre de clusters générés dans les résultats de sortie.
ITERATIONS nombre_itérations Nombre maximum de fois où le calcul des clusters est ré-effectué.
INITIALIZATIONS nombre_initialisations

Nombre de fois permettant de générer un premier ensemble de centroïdes aléatoires.

SEED valeur_départ

optionnel

Valeur de départ à utiliser pour lancer le générateur de nombres aléatoires dans Analytics.

Si vous omettez SEED, Analytics sélectionne aléatoirement la valeur de départ.

OTHER champ <...n>

optionnel

Un ou plusieurs champs supplémentaires à inclure dans la sortie.

Remarque

Les champs clés sont inclus automatiquement dans la table de sortie et ne doivent pas être spécifiés à l'aide de OTHER.

TO nom_table

Emplacement vers lequel envoyer les résultats de la commande :

  • nom_table enregistre les résultats dans une table Analytics

    Indiquez nom_table sous forme de chaîne entre guillemets avec une extension de fichier .FIL. Par exemple : TO "Sortie.FIL"

    Par défaut, le fichier de données de table (.FIL) est enregistré dans le dossier contenant le projet Analytics.

    Utilisez un chemin de fichier absolu ou relatif pour enregistrer le fichier de données dans un autre dossier existant :

    • TO "C:\Sortie.FIL"
    • TO "Résultats\Sortie.FIL"

    Remarque

    La longueur des noms des tables est limitée à 64 caractères alphanumériques, sans l'extension .FIL. Le nom peut inclure le caractère de soulignement ( _ ), mais aucun autre caractère spécial ni espace. Le nom ne peut pas commencer par un chiffre.

IF test

optionnel

Expression conditionnelle qui doit être vraie afin de traiter chaque enregistrement. La commande est exécutée uniquement sur les enregistrements remplissant la condition.

Remarque

La condition IF est évaluée uniquement par rapport aux enregistrements restant dans une table après application des options relevant du champ d'application (WHILE, FIRST, NEXT).

WHILE test

optionnel

Expression conditionnelle qui doit être vraie afin de traiter chaque enregistrement. La commande est exécutée jusqu'à ce que la condition soit évaluée comme fausse ou lorsque la fin de la table est atteinte.

Remarque

Si vous utilisez WHILE conjointement avec FIRST ou NEXT, le traitement des enregistrements s'arrête dès qu'une limite est atteinte.

FIRST plage | NEXT plage

optionnel

Le nombre d'enregistrements à traiter :

  • FIRST pour commencer le traitement à partir du premier enregistrement jusqu'à ce que le nombre d'enregistrements spécifié soit atteint
  • NEXT pour commencer le traitement à partir de l'enregistrement actuellement sélectionné jusqu'à ce que le nombre d'enregistrements spécifié soit atteint

Utilisez plage pour indiquer le nombre d'enregistrements à traiter.

Si vous ignorez FIRST et NEXT, tous les enregistrements sont traités par défaut.

OPEN

optionnel

Ouvre la table créée par la commande après l'exécution de la commande. Valide uniquement lorsque la commande crée une table de sortie.

aucun_mot_clé | NOCENTER | NOSCALE

Méthode permettant de standardiser les valeurs numériques des champs clés.

  • aucun_mot_clé centre les valeurs de champ clé aux alentours de zéro (0) et met à l'échelle les valeurs sur l'écart à l'unité lors du calcul des clusters
  • NOCENTER met à l'échelle les valeurs de champ clé sur l'écart à l'unité lors du calcul des clusters, mais ne centre pas les valeurs aux alentours de zéro (0)
  • NOSCALE utilise les valeurs de champ clé brutes, non mises à l'échelle, lors du calcul des clusters

Exemples

Exécuter la commande Cluster sur le montant des factures

En plus de stratifier une table Comptabilité client sur le champ Montant_facture, vous décidez également d'exécuter la commande Cluster sur le même champ.

  • La stratification regroupe les montants par couche présentant des limites numériques prédéfinies, par exemple, des intervalles de 1000 $.
  • Le regroupement en clusters permet de détecter les regroupements organiques de montants existant dans les données sans que vous ayez à décider d'avance des limites numériques.
Ouvrir Ar
CLUSTER ON Montant_Facture KVALUE 8 ITERATIONS 30 INITIALIZATIONS 10 OTHER Num Date d'échéance Réf Type TO "Factures_en_cluster" NOSCALE

Pour connaître rapidement le nombre d'enregistrements contenus dans chaque cluster de sortie, vous classez la table de sortie Factures_en_cluster sur le champ Cluster.

OPEN Factures_en_cluster
CLASSIFY ON Cluster TO SCREEN

Remarques

Remarque

Pour plus d'informations sur le fonctionnement de cette commande, consultez le Aide d'Analytics.

Guide de création de scripts ACL 14.1