Datensätze sortieren

Sie können Datensätze in aufsteigender oder absteigender sequenzieller Reihenfolge sortieren und die Ergebnisse in einer neuen, physisch neu angeordneten Analytics-Tabelle ausgeben. Die Ausgabe in eine Analytics-Tabelle ist die einzige Ausgabeoption.

Das Sortieren von Datensätzen ist eine Voraussetzung für mehrere Analytics-Operationen. Weitere Informationen finden Sie unter Sollte ich eine explizite Sortierung oder eine Vorsortierung verwenden?

Das Sortieren kann auch bereits für sich allein eine nützliche Analyse darstellen, weil dadurch Muster und Anomalien auffallen.

Hinweis

Das Indizieren von Datensätzen ist eine Alternative zum Sortieren und kann in bestimmten Situationen die bessere Wahl sein. Weitere Informationen finden Sie unter Sollte ich sortieren oder indizieren?

Sollte ich den gesamten Datensatz oder nur spezifische Felder ausgeben?

Bei der Sortierung haben Sie die Möglichkeit, den gesamten Datensatz oder nur angegebene Felder in die sortierte Ausgabetabelle aufzunehmen. Jede Option hat bestimmte Auswirkungen, die im Folgenden zusammengefasst werden.

Die von Ihnen gewählte Option kann sich auch auf die Sortiergeschwindigkeit auswirken. Weitere Informationen finden Sie unter Wie die Sortierung beschleunigt werden kann.

Tipp

Wenn Sie einige der Charakteristiken der Feldausgabe wünschen, jedoch den gesamten Datensatz benötigen, geben Sie nach Feldern aus und wählen Sie alle Felder.

Ausgabetyp Auswirkungen
Datensatz
  • Der gesamte Datensatz ist in der sortierten Ausgabetabelle enthalten.
  • Kalkulationsfelder bleiben als berechnete Ausdrücke erhalten.
  • Verbundene Felder können nicht eingeschlossen werden. Die neue Ausgabetabelle weist jedoch automatisch eine Verbindung zur ursprünglichen untergeordneten Tabelle auf und Sie können Felder aus der untergeordneten Tabelle der Ansicht der Ausgabetabelle hinzufügen.
Felder
  • Nur angegebene Felder werden in die sortierte Ausgabetabelle aufgenommen. Schlüsselfelder sind automatisch beinhaltet und müssen nicht angegeben werden.
  • Kalkulationsfelder werden in physische Felder konvertiert, die mit den tatsächlich berechneten Werten aufgefüllt wurden.
  • Verbundene Felder können eingeschlossen werden. Sie werden in der Ausgabetabelle zu permanenten physischen Feldern. Die neue Ausgabetabelle ist nicht mehr mit der ursprünglichen untergeordneten Tabelle verbunden.

 

Nach mehreren Schlüsselfeldern sortieren

Sie können Datensätze mithilfe eines Schlüsselfelds sortieren, oder Sie können verschachtelte Sortierschemata erstellen, indem Sie nach mehreren Schlüsselfeldern sortieren (primäres Schlüsselfeld, sekundäres Schlüsselfeld usw.). Beim verschachtelten Sortieren wird das Kombinieren von Datentypen und das Kombinieren von aufsteigenden und absteigenden Reihenfolgen über mehrere Schlüsselfelder hinweg unterstützt.

Beispiel

Sie möchten eine Transaktionstabelle in aufsteigender Reihenfolge nach einem Datum-Schlüsselfeld und für jeden Tag in absteigender Reihenfolge nach einem Betrag-Schlüsselfeld sortieren.

Das folgende Ergebnis veranschaulicht eine verschachtelte Sortierung, die Datentypen (Datumzeit und numerisch) vermischt und eine aufsteigende sowie absteigende Reihenfolge verwendet.

 

Feld „Datum“

(aufsteigende Reihenfolge)

Feld „Betrag“

(absteigende Reihenfolge, verschachtelt)

15 Jan 2011

$2300,00

15 Jan 2011

$1200,00

15 Jan 2011

$600,00

16 Jan 2011

$900,00

16 Jan 2011

$100,00

17 Jan 2011

$4700,00

17 Jan 2011

$900,00

17 Jan 2011

$500,00

Wie die Sortierung beschleunigt werden kann

Das Sortieren sehr großer Tabellen mit Millionen Datensätzen kann zeitaufwendig sein. Das Sortieren stellt erhebliche Anforderungen an die Systemressourcen und kann verlangsamt werden, wenn Sie gleichzeitig andere Aufgaben ausführen.

Sortiergeschwindigkeit verbessern

Zwei Optionen können die Sortiergeschwindigkeit verbessern:

  • Eine Teilmenge von Feldern ausgeben Wenn Sie nur einen Teil der im Datensatz enthaltenen Daten benötigen, sollten Sie nicht den gesamten Datensatz in die sortierte Ausgabetabelle aufnehmen. Wählen Sie nur die benötigten Felder aus, wodurch die Sortierung oft beschleunigt wird.

    Je kleiner die Teilmenge der Felder im Verhältnis zur Gesamtanzahl der Filter ist, umso mehr verbessert sich die Performance.

  • Den für die Sortierung verfügbaren Speicher erhöhen Sie können eine bestimmte Speichermenge für die Sortierung zuweisen, bis zu einem Maximum von 2000 MB. Gehen Sie auf Extras > Optionen > Tabelle > Sortierungsspeicher, oder verwenden Sie den Befehl SET SORTMEMORY.

Zusätzliche Vorschläge

Wenn die aufgewendete Zeitdauer zur Sortierung großer Tabellen problematisch bleibt, erwägen Sie die folgenden Schritte:

  • Ihre Computerhardware aktualisieren
  • ein Skript erstellen, um Daten geplant während der Nacht zu sortieren

Sollte ich eine explizite Sortierung oder eine Vorsortierung verwenden?

Die Sortierung von Datensätzen vor folgenden Operationen kann eine Voraussetzung oder empfohlen sein:

  • Zusammenführen von Tabellen
  • Mischen von Tabellen
  • Zusammenfassen (wenn Sie eine einzelne Gruppe für jede Menge identischer Werte innerhalb des Schlüsselfelds möchten).
  • Auf Duplikate testen
  • Auf Lücken testen

Alle diese Operationen enthalten die Option Vorsortieren, die es Ihnen ermöglicht, beim Durchführen der Operation eine vorläufige sequenzielle Sortierung von Datensätzen durchzuführen.

Wenn Sie zwei oder mehrere dieser Operationen für dieselbe Tabelle durchführen, ist es möglicherweise effizienter, die Tabelle zunächst explizit zu sortieren, anstatt wiederholt den Befehl Vorsortieren zu verwenden, insbesondere wenn die Tabelle eine große Anzahl von Datensätzen enthält.

Das Vorhandensein aller Quelldatensätze in der Ausgabetabelle überprüfen

Wenn Sie alle Datensätze in einer Tabelle sortieren und ausgeben, können Sie eine Kontrollsumme für ein numerisches Feld festlegen, um zu verifizieren, dass alle Datensätze tatsächlich in der neuen Tabelle ausgegeben werden.

Eine Kontrollsumme für ein Feld legen Sie im Dialogfeld Tabellenlayout fest. Sobald Sie die Datensätze sortiert und ausgegeben haben, wählen Sie in der neuen Tabelle Extras > Tabellenverlauf aus, um die Kontrollsummen für Eingabe und Ausgabe zu vergleichen. Weitere Informationen finden Sie unter Physisches Feld definieren.

Schritte

Sie können Datensätze anhand eines oder mehrerer Schlüsselfelder in der aktiven Tabelle sortieren und die Ergebnisse in einer neuen Analytics-Tabelle ausgeben. Sie können den gesamten Datensatz oder nur angegebene Felder in die sortierte Ausgabetabelle aufnehmen.