CLUSTER-Befehl

Gruppiert Datensätze nach ähnlichen Werten von ein oder mehreren numerischen Feldern in Clustern. Cluster können eindimensional oder mehrdimensional sein.

Hinweis

Der CLUSTER-Befehl wird nicht unterstützt, falls Sie Analytics auf einem 32-Bit-Computer ausführen. Die für den Befehl benötigten Berechnungen sind rechenintensiv und für 64-Bit-Computer besser geeignet.

Syntax

CLUSTER ON Schlüsselfeld <...n> KVALUE Anzahl_Cluster ITERATIONS Anzahl_Iterationen INITIALIZATIONS Anzahl_Initialisierungen <SEED Grundwert> <OTHER Feld < ...n>> TO Tabellenname <IF Test> <WHILE Test> <FIRST Bereich|NEXT Bereich> OPEN {kein_Schlüsselwort|NOCENTER|NOSCALE}

Parameter

Name Beschreibung
ON Schlüsselfeld <...n>

Ein oder mehrere numerische Felder für die Clusterbildung. Mehrere Felder müssen durch Leerzeichen getrennt werden.

KVALUE Anzahl_Cluster Die Anzahl der Cluster in den Ausgabetabellen.
ITERATIONS Anzahl_Iterationen Wie oft die Clusterberechnung erneut durchgeführt wird.
INITIALIZATIONS Anzahl_Initialisierungen

Wie oft eine Anfangsmenge mit zufälligen Schwerpunkten erstellt werden soll.

SEED Grundwert

Optional

Der Grundwert, der verwendet wird, um den Zufallszahlen-Generator in Analytics zu initialisieren.

Wenn Sie SEED auslassen, wird Analytics den Grundwert zufällig auswählen.

OTHER Feld <...n>

Optional

Ein oder mehrere weitere Felder zum Einfügen in die Ausgabe.

Hinweis

Schlüsselfelder werden automatisch in die Ausgabetabelle aufgenommen und müssen nicht mit OTHER angegeben werden.

TO Tabellenname

Der Ort, an den die Ergebnisse des Befehls gesendet werden sollen:

  • Tabellenname Speichert die Ergebnisse in einer Analytics-Tabelle.

    Geben Sie Tabellenname als in Anführungszeichen gesetzte Zeichenfolge mit der Dateierweiterung „.FIL“ an. Beispiel: TO "Ausgabe.FIL"

    Standardmäßig wird die Tabellendatendatei (.FIL) im Ordner mit dem Analytics-Projekt gespeichert.

    Verwenden Sie entweder einen absoluten oder relativen Dateipfad, um die Datendatei in einen anderen bestehenden Ordner zu speichern:

    • TO "C:\Ausgabe.FIL"
    • TO "Ergebnisse\Ausgabe.FIL"

    Hinweis

    Tabellennamen sind auf 64 alphanumerische Zeichen beschränkt, was die .FIL-Dateierweiterung nicht einbezieht. Der Name kann den Unterstrich beinhalten ( _ ), aber keine anderen Sonderzeichen oder Leerzeichen. Er kann nicht mit einer Ziffer beginnen.

IF Test

Optional

Ein bedingter Ausdruck, der wahr sein muss, damit ein Datensatz verarbeitet wird. Der Befehl wird nur für Datensätze ausgeführt, welche die Bedingung erfüllen.

Hinweis

Der IF-Parameter wird nur für Datensätze ausgewertet, die nach Anwendung von Bereichsparametern (WHILE, FIRST, NEXT) in einer Tabelle übrig sind.

WHILE Test

Optional

Ein bedingter Ausdruck, der wahr sein muss, damit ein Datensatz verarbeitet wird. Der Befehl wird ausgeführt, bis die Bedingung falsch ist oder das Tabellenende erreicht wurde.

Hinweis

Wenn Sie WHILE zusammen mit FIRST oder NEXT verwenden, endet die Datensatzverarbeitung, sobald eine Grenze erreicht wird.

FIRST Bereich | NEXT Bereich

Optional

Die Anzahl der zu verarbeitenden Datensätze:

  • FIRST Verarbeitung beim ersten Datensatz beginnen, bis die angegebene Datensatzanzahl erreicht wird
  • NEXT Verarbeitung beim aktuell ausgewählten Datensatz beginnen, bis die angegebene Datensatzanzahl erreicht wird

Verwenden Sie Bereich, um die Anzahl der zu verarbeitenden Datensätze anzugeben.

Wenn Sie FIRST und NEXT nicht angeben, werden standardmäßig alle Datensätze verarbeitet.

OPEN

Optional

Öffnet die durch den Befehl erstellte Tabelle, nachdem der Befehl ausgeführt wird. Nur gültig, wenn der Befehl eine Ausgabetabelle erstellt.

kein_Schlüsselwort | NOCENTER | NOSCALE

Die Methode des Standardisierens numerischer Werte im Schlüsselfeld.

  • kein_Schlüsselwort Schlüsselfeldwerte rund um null (0) zentrieren und Werte zur Berechnung der Cluster auf Einheitsvarianz skalieren
  • NOCENTER Schlüsselfeldwerte zur Berechnung der Cluster auf Einheitsvarianz skalieren, aber Werte nicht rund um null (0) zentrieren
  • NOSCALE Rohe Schlüsselfeldwerte zur Berechnung der Cluster ohne Skalierung verwenden

Beispiele

Clustering nach Rechnungsbetrag

Neben einer Schichtung einer Forderungstabelle für das Feld Rechnungsbetrag möchten Sie auch Cluster für dasselbe Feld bilden.

  • Durch die Schichtenbildung werden die Beträge in Schichten mit vordefinierten numerischen Grenzen, z.B. Intervalle von EUR 1000, aufgeteilt.
  • Durch Clustering werden organische Gruppierungen von Beträgen entdeckt, ohne dass es notwendig ist, dass Sie numerische Grenzen vorab festlegen.
OPEN Forderungen
CLUSTER ON Rechnungsbetrag KVALUE 8 ITERATIONS 30 INITIALIZATIONS 10 OTHER Nr Fälligkeitsdatum Ref Typ TO "Rechnungs-Cluster" NOSCALE

Um schnell herauszufinden, wie viele Datensätze sich in jedem ausgegebenen Cluster befinden, klassifizieren Sie die Ausgabetabelle „Rechnungs-Cluster“ auf Basis des Felds Cluster.

OPEN Rechnungs-Cluster
CLASSIFY ON Cluster TO SCREEN

Bemerkungen

Hinweis

Weitere Informationen über die Funktion dieses Befehls finden Sie in Hilfe für Analytics.