Zusammenführen von Tabellen

Das Zusammenführen von Tabellen ermöglicht Ihnen, zwei Analytics-Tabellen mit verschiedenen Datensatzstrukturen in einer neuen dritten Tabelle zu kombinieren. Sie können eine beliebige Kombination von Feldern aus den beiden ursprünglichen Tabellen für die Aufnahme in der neuen Tabelle auswählen.

Datensatzstrukturen unterscheiden sich, wenn sie ein oder mehrere unterschiedliche Felder (Datenelemente) aufweisen. Das Zusammenführen ist eine gute Wahl für Recherchearbeit, die einen dauerhaft zusammengeführten Datenbestand als Ausgangspunkt für die Analyse erfordert.

Beispiel

Szenario

Sie möchten Lieferanten identifizieren, die auch Mitarbeiter sind. Dies ist eine Möglichkeit, um Daten auf möglicherweise unangemessene Zahlungen zu analysieren.

Ansätze

Sie führen die Lieferantenstammtabelle mit der Tabelle „Mitarbeiter“ zusammen und verwenden dabei das gemeinsame Schlüsselfeld „Adresse“.

Die zusammengeführte Ausgabetabelle beinhaltet Lieferanten und Mitarbeiter mit derselben Adresse.

Hinweis

Informationen über das Zusammenführen von Tabellen im Fenster „Datenzugriff“ als Bestandteil des Datenimportvorgangs finden Sie unter Tabellen im Fenster „Datenzugriff“ zusammenführen.

Dieses Thema behandelt das Zusammenführen von Analytics-Tabellen, sobald sie sich in Analytics befinden.

Tabellen über ein gemeinsames Schlüsselfeld zusammenführen

Sie führen Tabellen über ein gemeinsames Schlüsselfeld zusammen, also ein Datenelement wie Mitarbeiternummer, Lieferanten-ID oder Adresse, das in beiden Tabellen enthalten ist. Wenn identische Werte in den beiden Schlüsselfeldern vorhanden sind, ist das Ergebnis eine Übereinstimmung, die einzelne Datensätze aus den separaten Tabellen zusammenführt.

Im folgenden Beispiel werden eine Lieferantenstammtabelle und eine Mitarbeiterstammtabelle über das in jeder Tabelle auftretende Adressfeld als gemeinsamer Schlüssel (Vendor_Street und Emp_Address) zusammengeführt. Die Ausgabetabelle enthält zwei zusammengeführte Datensätze. Im Beispiel werden die nicht zusammengeführten Datensätze jeder Tabelle auch in die Ausgabetabelle aufgenommen. Dies ist eine Option, die Sie auswählen können.

Tabellen durch ähnliche oder fast identische Schlüsselfeldwerte zusammenführen

Die Analytics-Fuzzy-Zusammenführung verwendet eine Fuzzy-Übereinstimmung von Schlüsselfeldwerten, um zwei Analytics-Tabellen in einer neuen dritten Tabelle zu vereinen. In vielerlei Hinsicht entspricht eine Fuzzy-Zusammenführung einer gewöhnlichen Analytics-Zusammenführung. Der Hauptunterschied besteht darin, dass Datensätze nicht nur auf Basis einer genauen Übereinstimmung von Schlüsselfeldwerten zusammengeführt werden. Eine Fuzzy-Zusammenführung kann Datensätze auch auf Basis einer ähnlichen Übereinstimmung zusammenführen.

Weitere Informationen finden Sie unter Fuzzy-Zusammenführung.

Anforderungen für Schlüsselfelder

Die Schlüsselfelder in den zusammenzuführenden Tabellen müssen einige Voraussetzungen erfüllen.

Primär- und Sekundärtabellen und Schlüsselfelder

Bei der Zusammenführung werden die Tabellen und Schlüsselfelder basierend auf der Reihenfolge beim Öffnen der Tabellen als primär bzw. sekundär bezeichnet:

  • Primärtabelle die erste geöffnete Tabelle
  • Primärschlüsselfeld das aus der Primärtabelle ausgewählte Schlüsselfeld
  • Sekundärtabelle die zweite geöffnete Tabelle

    Das Öffnen einer Sekundärtabelle hat zur Folge, dass sie einer Primärtabelle zugeordnet und zur Verarbeitung bereitgestellt wird. Sekundärtabellen werden nicht in der Registerkarte "Ansicht" geöffnet.

  • Sekundärschlüsselfeld das aus der Sekundärtabelle ausgewählte Schlüsselfeld

Sie können Primär- und Sekundärtabellen sowie Schlüsselfelder frei wählen. Das Zusammenführen ist jedoch nur dann erfolgreich, wenn die Schlüsselfelder den Anforderungen für das Anforderungen für Schlüsselfelder.

Weitere Informationen finden Sie unter Über Schlüsselfelder.

Übereinstimmende gegenüber nicht übereinstimmenden Datensätzen

Wenn Sie mit Zusammenführungen arbeiten, müssen Sie sowohl die übereinstimmenden als auch die nicht übereinstimmenden Datensätze beachten:

  • Übereinstimmende Datensätze Primär- und Sekundärdatensätze stimmen überein, wenn sie in den primären und sekundären Schlüsselfeldern identische Werte aufweisen.

    Hinweis

    In Abhängigkeit von Ihrem gewählten Zusammenführungstyp werden doppelte Instanzen übereinstimmender Sekundärschlüsselwerte unter Umständen nicht zusammengeführt. Weitere Informationen finden Sie unter Warum fehlen einige Datensätze der Sekundärtabelle in der zusammengeführten Ausgabetabelle?

  • Nicht übereinstimmende Datensätze Primär- und Sekundärdatensätze stimmen nicht überein, wenn sie in den primären und sekundären Schlüsselfeldern keine identischen Werte aufweisen.

Welche Datensätze enthält die zusammengeführte Tabelle?

Übereinstimmende und nicht übereinstimmende Schlüsselfeldwerte und der durchgeführte Zusammenführungstyp bestimmen, welche Datensätze der zwei ursprünglichen Tabellen in die neue, zusammengeführte Tabelle einbezogen werden.

Zusammenführungstypen

Analytics unterstützt sechs verschiedene Zusammenführungstypen, die im Folgenden zusammengefasst werden. Spezifische Beispiele finden Sie unter Beispiele von Zusammenführungstypen.

Zusammenführungstyp In der zusammengeführten Tabelle enthaltene Datensätze
Übereinstimmende Primärdatensätze Nicht übereinstimmende Primärdatensätze Übereinstimmende Sekundärdatensätze Nicht übereinstimmende Sekundärdatensätze

Übereinstimmende Primär- und Sekundärdatensätze

(erster übereinstimmender Sekundärdatensatz)

 

Nicht beinhaltet: doppelte Instanzen mit übereinstimmenden Sekundärschlüsselwerten

 

Übereinstimmende Primär- und Sekundärdatensätze

(alle übereinstimmenden Sekundärdatensätze)

 

Beinhaltet und zusammengeführt: doppelte Instanzen mit übereinstimmenden Sekundärschlüsselwerten

 

Nicht übereinstimmende Primärdatensätze

 

 

 

Alle Primär- und übereinstimmenden Sekundärdatensätze

Nicht beinhaltet: doppelte Instanzen mit übereinstimmenden Sekundärschlüsselwerten

 

Alle Sekundär- und übereinstimmenden Primärdatensätze

 

Beinhaltet, aber nicht zusammengeführt: doppelte Instanzen mit übereinstimmenden Sekundärschlüsselwerten

Beinhaltet: doppelte Instanzen mit nicht übereinstimmenden Sekundärschlüsselwerten

Alle Primär- und Sekundärdatensätze

Beinhaltet, aber nicht zusammengeführt: doppelte Instanzen mit übereinstimmenden Sekundärschlüsselwerten

Beinhaltet: doppelte Instanzen mit nicht übereinstimmenden Sekundärschlüsselwerten

Warum fehlen einige Datensätze der Sekundärtabelle in der zusammengeführten Ausgabetabelle?

Fünf der sechs Analytics-Zusammenführungstypen führen doppelte Instanzen übereinstimmender Sekundärschlüsselwerte nicht zusammen. Doppelte Vorkommen übereinstimmender Primärschlüsselwerte werden zusammengeführt, sie werden aber allesamt mit der ersten Instanz des übereinstimmenden sekundären Schlüsselwerts zusammengeführt. Diese Zusammenführungstypen werden breit als n:1-Zusammenführungen bezeichnet.

Um alle übereinstimmenden Sekundärschlüsselwerte zusammenzuführen, gehen Sie anhand einer der folgenden Methoden vor:

  • Tabellen umkehren Kehren Sie in der Zusammenführung Primär- und Sekundärtabellen um. Diese Methode eignet sich, wenn die Werte im Schlüsselfeld innerhalb der ursprünglichen Primärtabelle eindeutig sind. Wenn es doppelte Vorkommen von Primärschlüsselwerten in beiden Tabellen gibt, führt diese Methode nicht zu den gewünschten Ergebnisse.
  • n:n-Zusammenführung verwenden Verwenden Sie den Zusammenführungstyp Übereinstimmende Primär- und Sekundärdatensätze (alle übereinstimmenden Sekundärdatensätze).

n:1- und n:n-Zusammenführungen

Sie werden sehen, dass Analytics-Zusammenführungen als n:1-Zusammenführung und eine der sechs Zusammenführungstypen als n:n-Zusammenführung bezeichnet werden. Diese Bezeichnungen beschreiben allgemein das Verhalten von Analytics-Zusammenführungen. Es handelt sich bei den Begriffen aber auch um Verallgemeinerungen, die das Verhalten der Zusammenführung nicht vollständig beschreiben.

n:1-Zusammenführungen in Analytics

Mit einer Ausnahme sind die Zusammenführungstypen in Analytics n:1-Zusammenführungen. Sie funktionieren auch als 1:1-Zusammenführungen, falls alle Werte des Primärschlüsselfelds eindeutig sind.

n:n-Zusammenführung in Analytics

Ein Analytics-Zusammenführungstyp (Übereinstimmende Primär- und Sekundärdatensätze (alle übereinstimmenden Sekundärdatensätze)) beinhaltet alle übereinstimmenden Primär- und Sekundärdatensätze. Dieser Zusammenführungstyp wird auch als n:n-Zusammenführung bezeichnet.

Die n:n-Zusammenführung funktioniert auch als 1:n-Zusammenführung, falls alle Werte des Primärschlüsselfelds eindeutig sind.

Unterschied zwischen Analytics- und SQL-Zusammenführungen

Es besteht ein wichtiger Unterschied zwischen den Analytics-Zusammenführungen im Dialogfeld Zusammenführung und den SQL-Zusammenführungen, die beim Import von Daten in Analytics über das Fenster „Datenzugriff“ verfügbar sind:

  • Analytics-Zusammenführungen Doppelte übereinstimmende Sekundärschlüsselwerte werden nicht zusammengeführt (mit Ausnahme der n:n-Zusammenführung).
  • SQL-Zusammenführungen Alle doppelten übereinstimmenden Sekundärschlüsselwerte werden zusammengeführt, unabhängig vom gewählten Zusammenführungstyp.

    Näheres über SQL-Zusammenführungen im Fenster „Datenzugriff“ finden Sie in Tabellen im Fenster „Datenzugriff“ zusammenführen.

Hinweis

Analytics verwendet den Begriff „n:n-Zusammenführung“ auf eine eigene, Analytics-spezifische Weise. Eine n:n-Zusammenführung in SQL unterscheidet sich hiervon.

Sortieren von zusammengeführten Tabellen

Die resultierende zusammengeführte Tabelle wird in aufsteigender Reihenfolge nach dem primären Schlüsselfeld sortiert, sofern Sie das primäre Schlüsselfeld beim Zusammenführen vorsortieren oder für die Primärtabelle bereits diese Sortierung verwendet wird.

Falls Sie nicht sortieren oder nach dem primären Schlüsselfeld vorsortieren, verwendet die resultierende zusammengeführte Tabelle die vorhandene Sortierfolge der Primärtabelle.

Zusätzliche Informationen zum Sortieren und Zusammenführen

  • Es ist nicht erforderlich, dass die Primärtabelle sortiert ist. Die Verarbeitungszeit nimmt jedoch erheblich zu, wenn die Primärtabelle vollständig unsortiert oder in absteigender Reihenfolge sortiert ist.
  • Wenn Sie eine Zusammenführung mithilfe eines teilweise sortierten Primärtabellen-Schlüsselfelds durchführen (z.B. beim Zusammenführen eines Kontocodes, wenn die Tabelle nach Monat und dann nach Kontocode sortiert ist), so ist die Verarbeitungszeit nur unwesentlich länger.
  • Beim Zusammenführen ist die Option Vorsortieren sowohl für die Primär- als auch für die Sekundärtabelle vorhanden.
  • Die primären und sekundären Schlüsselfelder können anstelle der Sortierung auch indiziert werden. Das sekundäre Schlüsselfeld muss in aufsteigender Reihenfolge indiziert sein. Die Sekundärtabelle kann nur von der Befehlszeile aus oder über ein Skript indiziert werden.

Zusätzliche Informationen über das Zusammenführen

Die Tabelle unten bietet zusätzliche Informationen zum Zusammenführen.

 

Funktionsbereich

Details

Nicht übereinstimmende Datensätze und fehlende Feldwerte

Falls Sie nicht übereinstimmende primäre oder nicht übereinstimmende sekundäre Datensätze in eine Zusammenführung für die fehlenden Feldwerte einbeziehen, zeigt Analytics ein Leerfeld in Zeichen- und Datumzeitfeldern an, eine Null in numerischen Feldern und ein „F“ in logischen Feldern.

Duplikate oder Leerfelder im Schlüsselfeld der Sekundärtabelle

Wenn Duplikate oder fehlende Werte in einem Sekundärtabellen-Schlüsselfeld die nachfolgende Analyse ungültig machen, stellt die Vorverarbeitung der Sekundärtabelle in manchen Situationen ein mögliche Lösung dar, um Duplikate und/oder Leerfelder zu entfernen.

Teilweise Übereinstimmung

Teilweise Übereinstimmungen von Werten der Schlüsselfelder werden nicht unterstützt. Für eine Übereinstimmung müssen die Werte 100% identisch sein.

Beispiel:

  • übereinstimmend AB-123, AB-123
  • nicht übereinstimmend AB-123, 123

Hinweis

Teilweise Übereinstimmungen werden durch Analytics Fuzzy-Zusammenführung unterstützt.

Identische Schlüsselfeld-Länge nicht zwingend erforderlich

Mit Ausnahme von Zeichenschlüsselfeldern sind in Analytics identische Längen für die primären und sekundären Schlüsselfelder beim Zusammenführen von Tabellen nicht zwingend erforderlich.

Es wird empfohlen, stets identische Längen für numerische Schlüsselfelder zu verwenden und die Längen vor dem Zusammenführen gegebenenfalls manuell zu harmonisieren. Ergebnisse, die aus dem Zusammenführen numerischer Schlüsselfelder mit verschiedenen Längen resultieren, sind nicht zuverlässig.

Datumzeit-Schlüsselfelder können verschiedene Längen aufweisen, da Analytics beim Durchführen von Operationen, die Datum-, Datumzeit- oder Zeitwerte umfassen, ein internes Analytics-Datumzeitformat verwendet.

Harmonisieren von Ausrichtung und Groß-/Kleinschreibung

Wenn Sie Tabellen mithilfe von Zeichenschlüsselfeldern zusammenführen, müssen Ausrichtung und Groß-/Kleinschreibung übereinstimmen:

  • Beide Schlüsselfelder müssen dieselbe Ausrichtung aufweisen. Verwenden Sie die Funktion LTRIM( ), um führende Leerstellen aus den Schlüsselfeldern zu entfernen.

  • Beide Schlüsselfelder müssen dieselbe Groß-/Kleinschreibung aufweisen – GROSSBUCHSTABEN, kleinbuchstaben oder herkömmliche Groß-/Kleinschreibung. Passen Sie die Groß-/Kleinschreibung mit den Funktionen UPPER( ), LOWER( ) oder PROPER( ) an.

Anzahl der nicht in einer Zusammenführung enthaltenen Datensätze

Abhängig vom Typ der durchgeführten Zusammenführung sind Datensätze der Primär- und/oder Sekundärtabelle möglicherweise nicht in der zusammengeführten Tabelle enthalten. Das Befehlsprotokoll zeigt die Anzahl der nicht enthaltenen primären Datensätzen an (<n> Datensätze ausgesteuert), nicht jedoch die Anzahl der ausgesteuerten sekundären Datensätze.

In der Zusammenführung verwendete bedingte Ausdrücke und Bereichsoptionen

Bei n:1-Zusammenführungen gelten die Parameter "Wenn", "Solange", "Erste", "Nächste", die einschränken, welche Datensätze verarbeitet werden, nur für die Primärtabelle. Bei n:n-Zusammenführungen können sich die Ausdrücke "Wenn" und "Solange" auch auf die Sekundärtabelle beziehen.

Identische Feldnamen in zusammengeführten Tabellen

Wenn die primären und sekundären Schlüsselfelder oder sonstigen einbezogenen Felder identische Namen aufweisen, fügt Analytics eine „2“ am Ende des sekundären Feldnamens im Layout für die Ausgabetabelle hinzu. Beispiel: „Lieferantennr“ wird zu „Lieferantennr2“ (oder „Lieferantennr3“ usw., bis Analytics einen Namen findet, der mit keinem anderen Feldnamen in der Ausgabetabelle kollidiert).

Die alternativen Spaltentitel in der Ansicht für die Ausgabetabelle zeigen die identischen Namen weiterhin unverändert an.

Tabelle nicht als Sekundärtabelle verfügbar

Eine Tabelle kann nicht als Sekundärtabelle in einer Zusammenführung ausgewählt werden, wenn sie aktuell mit der primären/übergeordneten Tabelle als untergeordnete Tabelle verbunden ist. Um diese Einschränkung zu vermeiden, können Sie eine Kopie des primären/übergeordneten Tabellenlayouts oder des untergeordneten Tabellenlayout erstellen und mithilfe des kopierten Layouts zusammenführen, oder Sie können die Beziehung löschen.

Einschränkungen bezüglich des Speicherortes für zusammengeführte Tabellen

Um zusammengeführt zu werden, müssen sich Tabellen im selben Analytics-Projekt befinden. Servertabellen müssen sich auf demselben Server befinden und über dasselbe Serverprofil aufgerufen werden. Sie können eine lokale Tabelle nicht mit einer Servertabelle zusammenführen.

Größe der zusammengeführten Tabelle

Je nach Art der durchgeführten Zusammenführung kann die Anzahl von Datensätzen in der resultierenden Kombinationstabelle größer, gleich oder kleiner als die Summe der Datensätze in den zwei zusammenzuführenden Tabellen sein.

Zusammenführen von UTC-basierten und Nicht-UTC-Daten

Ein UTC-basiertes und ein Nicht-UTC-Datumzeit-Schlüsselfeld können zum Zusammenführen von zwei Tabellen verwendet werden (UTC ist die Coordinated Universal Time, die Uhrzeit an dem nullten Längengrad). Bei der Durchführung von Operationen mit Datumzeiten oder Zeiten verwendet Analytics ein internes Analytics-Datumzeitformat, sodass die folgenden Datumzeiten als identisch betrachtet werden:

  • UTC-basiert – 31.12.2014 10:30:15-05:00

  • Nicht-UTC – 31.12.2014 15:30:15

Sie sollten vorsichtig sein, falls Sie UTC-basierte und Nicht-UTC-Zeitdaten in einer Analytics-Operation verwenden. Obwohl Analytics die zwei obigen Zeitwerte als identisch betrachtet, ist dies logisch nicht sinnvoll, weil ein Wert auf eine Zeitzone Bezug nimmt und der andere Wert nicht. Weitere Informationen über UTC finden Sie unter Registerkarte „Datum und Zeit“ (Dialogfeld „Optionen“).

Hilfe für Analytics 14.1