Commande CLUSTER
Regroupe les enregistrements en clusters selon des valeurs similaires dans un ou plusieurs champs numériques. Les clusters peuvent être unidimensionels ou multidimensionnels.
Syntaxe
CLUSTER ON champ_fclé <...n> KVALUE nombre_de_clusters ITERATIONS nombre_itérations INITIALIZATIONS nombre_initialisations <SEED valeur_départ> <OTHER champ < ...n>> TOnom_table <IF test> <WHILE test> <FIRST plage|NEXT plage> OPEN {aucun_mot_clé|NOCENTER|NOSCALE}
Paramètres
Nom | Description |
---|---|
ON champ_clé <...n> |
Un ou plusieurs champs numériques à regrouper. Les champs multiples doivent être séparés par des espaces. |
KVALUE nombre_de_clusters | Nombre de clusters générés dans les résultats de sortie. |
ITERATIONS nombre_itérations | Nombre maximum de fois où le calcul des clusters est ré-effectué. |
INITIALIZATIONS nombre_initialisations |
Nombre de fois permettant de générer un premier ensemble de centroïdes aléatoires. |
SEED valeur_départ optionnel |
Valeur de départ à utiliser pour lancer le générateur de nombres aléatoires dans Analytics. Si vous omettez SEED, Analytics sélectionne aléatoirement la valeur de départ. |
OTHER champ <...n> optionnel |
Un ou plusieurs champs supplémentaires à inclure dans la sortie. Remarque Les champs clés sont inclus automatiquement dans la table de sortie et ne doivent pas être spécifiés à l'aide de OTHER. |
TO nom_table |
Emplacement vers lequel envoyer les résultats de la commande :
|
IF test optionnel |
Expression conditionnelle qui doit être vraie afin de traiter chaque enregistrement. La commande est exécutée uniquement sur les enregistrements remplissant la condition. Remarque La condition IF est évaluée uniquement par rapport aux enregistrements restant dans une table après application des options relevant du champ d'application (WHILE, FIRST, NEXT). |
WHILE test optionnel |
Expression conditionnelle qui doit être vraie afin de traiter chaque enregistrement. La commande est exécutée jusqu'à ce que la condition soit évaluée comme fausse ou lorsque la fin de la table est atteinte. Remarque Si vous utilisez WHILE conjointement avec FIRST ou NEXT, le traitement des enregistrements s'arrête dès qu'une limite est atteinte. |
FIRST plage | NEXT plage optionnel |
Le nombre d'enregistrements à traiter :
Utilisez plage pour indiquer le nombre d'enregistrements à traiter. Si vous ignorez FIRST et NEXT, tous les enregistrements sont traités par défaut. |
OPEN optionnel |
Ouvre la table créée par la commande après l'exécution de la commande. Valide uniquement lorsque la commande crée une table de sortie. |
aucun_mot_clé | NOCENTER | NOSCALE |
Méthode permettant de standardiser les valeurs numériques des champs clés.
|
Exemples
Exécuter la commande Cluster sur le montant des factures
En plus de stratifier une table Comptabilité client sur le champ Montant_facture, vous décidez également d'exécuter la commande Cluster sur le même champ.
- La stratification regroupe les montants par couche présentant des limites numériques prédéfinies, par exemple, des intervalles de 1000 $.
- Le regroupement en clusters permet de détecter les regroupements organiques de montants existant dans les données sans que vous ayez à décider d'avance des limites numériques.
Ouvrir Ar CLUSTER ON Montant_Facture KVALUE 8 ITERATIONS 30 INITIALIZATIONS 10 OTHER Num Date d'échéance Réf Type TO "Factures_en_cluster" NOSCALE
Pour connaître rapidement le nombre d'enregistrements contenus dans chaque cluster de sortie, vous classez la table de sortie Factures_en_cluster sur le champ Cluster.
OPEN Factures_en_cluster CLASSIFY ON Cluster TO SCREEN
Remarques
Remarque
Pour plus d'informations sur le fonctionnement de cette commande, consultez le Aide d'Analytics.