Beispiele von Zusammenführungstypen
Es folgen einige Beispiele, welche die sechs Typen von Zusammenführungen in Analytics illustrieren. Die Beispiele zeigen, wie Sie unterschiedliche Zusammenführungstypen verwenden können, um exakt die gewünschten Informationen in der zusammengeführten Ausgabetabelle zu erhalten.
Eine Übersichtsansicht der sechs Zusammenführungstypen sehen Sie unter Welche Datensätze enthält die zusammengeführte Tabelle?.
Um für die Zusammenführung von zwei Analytics-Tabellen eine Fuzzy-Übereinstimmung von Schlüsselfeldwerten zu verwenden, lesen Sie Fuzzy-Zusammenführung.
Beispieldaten
Die ersten fünf Beispiele verwenden die unten dargestellten Beispieldaten.
Primärtabelle
Sekundärtabelle
Beispieldaten und Einzelheiten
Tabelle „Lohnbuchhaltung“ (primär) |
Enthält eine einzelne Zahlungsperiode und alle Gehaltszahlungen. Der Mitarbeiter mit der ID 003 hat zwei Schecks erhalten. |
---|---|
Tabelle „Mitarbeiterstammdaten“ (sekundär) |
Wird von der Personalabteilung verwaltet. Mitarbeiterdatensätze bieten eine vollständige Liste der aktuellen Mitarbeiter sowie den Betrag, der für jeden Zahlungszeitraum an sie zu zahlen ist. Ein Mitarbeiter, 002, fehlt in der Tabelle. |
Zusammenführen |
In den folgenden Beispielen wird mithilfe des gemeinsamen Schlüsselfelds „Mitarbeiternummer“ die Tabelle „Lohnbuchhaltung“ mit der Tabelle „Mitarbeiterstammdaten“ zusammengeführt. Alle Beispiele sind n:1-Zusammenführungen. |
Ziel | In jedem Beispiel möchten Sie nach Unregelmäßigkeiten in der Lohnbuchhaltung suchen. |
Übereinstimmende Primär- und Sekundärdatensätze (erste Übereinstimmung der Sekundärdaten)
Beispiel
Test Sie möchten überprüfen, dass Mitarbeiter korrekt bezahlt wurden.
Ansatz Sie verwenden einen Zusammenführungstyp, der für jeden Datensatz in der Tabelle „Lohnbuchhaltung“ (P), für den in der Tabelle „Mitarbeiterstammdaten“ (S) eine Übereinstimmung vorhanden ist, einen Ausgabedatensatz erstellt.
Ausgabetabelle Beinhaltet alle Mitarbeiter, die bezahlt wurden und zugleich in der Tabelle „Mitarbeiterstammdaten“ enthalten sind.
Beachten Sie, dass die zwei Datensätze für Mitarbeiter 003 in der Primärtabelle mit demselben Datensatz von Mitarbeiter 003 in der Sekundärtabelle zusammengeführt werden.
Analyse In der Ausgabetabelle können Sie Scheckbetrag mit Zahlung pro Periode vergleichen, um zu überprüfen, dass ein Mitarbeiter ordnungsgemäß bezahlt wurde. Obwohl Mitarbeiter 003 zwei Schecks erhielt, war der Gesamtbetrag von $2000 korrekt.
Nicht übereinstimmende Primärdatensätze
Beispiel
Test Sie möchten herausfinden, ob jemand bezahlt wurde, der nicht als Mitarbeiter aufgeführt ist.
Ansatz Sie verwenden einen Zusammenführungstyp, der für jeden Datensatz in der Tabelle „Lohnbuchhaltung“ (P), für den in der Tabelle „Mitarbeiterstammdaten“ (S) keine Übereinstimmung vorhanden ist, einen Ausgabedatensatz erstellt.
Ausgabetabelle Beinhaltet alle Menschen, die bezahlt wurden, aber nicht in der Tabelle „Mitarbeiterstammdaten“ enthalten sind.
Analyse Jeder Datensatz in der Ausgabetabelle muss überprüft werden.
Mitarbeiter 002 könnte ein gültiger Mitarbeiter sein, der aus Versehen nicht in die Tabelle „Mitarbeiterstammdaten“ aufgenommen wurde oder unter einer falschen Mitarbeiternummer geführt wird. Mitarbeiter 002 könnte aber auch ein Phantommitarbeiter sein, der im Rahmen betrügerischer Machenschaften erstellt wurde.
Alle Primärdatensätze und übereinstimmende Sekundärdatensätze
Beispiel
Test Sie möchten Beträge für alle ausgestellten Schecks überprüfen.
Ansatz Sie verwenden einen Zusammenführungstyp, der für jeden Datensatz in der Tabelle „Lohnbuchhaltung“ (P) einen Ausgabedatensatz erstellt, unabhängig davon, ob in der Tabelle „Mitarbeiterstammdaten“ (S) eine Übereinstimmung vorhanden ist.
Ausgabetabelle Beinhaltet eine vollständige Liste der Menschen, die bezahlt wurden.
Analyse In der Ausgabetabelle können Sie Scheckbetrag mit Zahlung pro Periode vergleichen, um zu überprüfen, dass ein Mitarbeiter ordnungsgemäß bezahlt wurde. Sie sehen, dass Mitarbeiter 002 $2200 bezahlt wurde, obwohl ihm laut den Angaben im Feld Zahlung pro Periode nichts zustand.
Hinweis
Analytics füllt fehlende sekundäre Felder für nicht übereinstimmende Primärdatensätze mit Leerfeldern oder Nullen.
Alle Sekundärdatensätze und übereinstimmende Primärdatensätze
Beispiel
Test Sie möchten überprüfen, ob alle Mitarbeiter innerhalb der Tabelle „Mitarbeiterstammdaten“ bezahlt wurden.
Ansatz Sie verwenden einen Zusammenführungstyp, der für jeden Datensatz in der Tabelle „Mitarbeiterstammdaten“ (S) einen Ausgabedatensatz erstellt, unabhängig davon, ob in der Tabelle „Lohnbuchhaltung“ (P) eine Übereinstimmung vorhanden ist.
Ausgabetabelle Beinhaltet eine vollständige Liste aller Mitarbeiter und ihrer Bezahlung.
Analyse In der Ausgabetabelle können Sie Scheckbetrag mit Zahlung pro Periode vergleichen, um zu überprüfen, ob ein Mitarbeiter bezahlt wurde und ob die Zahlung ordnungsgemäß war. Sie sehen, dass die Mitarbeiter 004 und 005 gar nicht bezahlt wurden.
Hinweis
Analytics füllt fehlende primäre Felder für nicht übereinstimmende Sekundärdatensätze mit Leerfeldern oder Nullen.
Alle Primärdatensätze und Sekundärdatensätze, übereinstimmend und nicht übereinstimmend
Beispiel
Test Sie möchten alle Lohnbuchhaltungs- und Mitarbeiterdaten untersuchen.
Ansatz Sie verwenden einen Zusammenführungstyp, der Folgendes erstellt:
- einen Ausgabedatensatz für jeden Datensatz in der Tabelle „Lohnbuchhaltung“ (P), für den in der Tabelle „Mitarbeiterstammdaten“ (S) eine Übereinstimmung vorhanden ist
- einen Ausgabedatensatz für jeden Datensatz, der in einer der beiden Tabellen keine Übereinstimmung aufweist
Ausgabetabelle Beinhaltet alle Lohnbuchhaltungs- und Mitarbeiterdaten, unabhängig davon, ob sie Übereinstimmungen aufweisen.
Analyse In der Ausgabetabelle können Sie Scheckbetrag mit Zahlung pro Periode vergleichen:
- um zu überprüfen, ob ein Mitarbeiter bezahlt wurde und ob die Zahlung ordnungsgemäß war
- um Menschen zu finden, die bezahlt wurden, aber nicht in der Tabelle „Mitarbeiterstammdaten“ enthalten sind
- um Mitarbeiter zu finden, die nicht bezahlt wurden
Hinweis
Analytics füllt fehlende Felder für nicht übereinstimmende Datensätze mit Leerfeldern oder Nullen.
Übereinstimmende Primär- und Sekundärdatensätze (alle übereinstimmenden Sekundärdatensätze)
Das Beispiel verwendet die unten dargestellten Beispieldaten.
Primärtabelle
Sekundärtabelle
Beispieldaten und Einzelheiten
Tabelle „Lohnbuchhaltung“ (primär) |
Die vollständige Lohnbuchhaltungstabelle beinhaltet alle Zahlungszeiträume und alle Lohn- und Gehaltsauszahlungen für 2018. Im Beispiel werden die Auszahlungen im Januar und Februar verwendet. |
---|---|
Tabelle „Mitarbeiterstammdaten“ (sekundär) |
Wird von der Personalabteilung verwaltet. Die Tabelle „Mitarbeiterstammdaten“ enthält:
Es gibt zwei Datensätze für Mitarbeiter 006:
|
Zusammenführen |
Im folgenden Beispiel wird mithilfe des gemeinsamen Schlüsselfelds „Mitarbeiternummer“ die Tabelle „Lohnbuchhaltung“ mit der Tabelle „Mitarbeiterstammdaten“ zusammengeführt. Das Beispiel stellt eine n:n-Zusammenführung dar. |
Ziel | In dem Beispiel möchten Sie nach Unregelmäßigkeiten in der Lohnbuchhaltung suchen. |
Beispiel
Test Sie möchten überprüfen, dass Mitarbeiter korrekt bezahlt wurden.
Ansatz Sie verwenden einen Zusammenführungstyp, der für jede Übereinstimmung von Datensätzen in der Tabelle „Lohnbuchhaltung“ (P) und der Tabelle „Mitarbeiterstammdaten“ (S) einen Ausgabedatensatz erstellt.
Hinweis
Da beide Quelltabellen in der Zusammenführung mehrere Instanzen mit übereinstimmenden Schlüsselwerten enthalten, müssen Sie den Zusammenführungstyp verwenden, der alle sekundären Übereinstimmungen enthält, um sicherzustellen, dass Sie alle relevanten Daten erfassen und korrekte Ergebnisse erzielen.
Ausgabetabelle Beinhaltet für jedes Zahlungsdatum alle Mitarbeiter, die bezahlt wurden und zugleich in der Tabelle „Mitarbeiterstammdaten“ enthalten sind.
Analyse In der Ausgabetabelle können Sie Scheckbetrag mit Zahlung pro Periode vergleichen, um zu überprüfen, dass ein Mitarbeiter an jedem Zahlungsdatum ordnungsgemäß bezahlt wurde.
Da Sie einen Zusammenführungstyp verwendet haben, der alle sekundären Übereinstimmungen einschließt (die n:n-Zusammenführung von Analytics), ist die Erhöhung des Scheckbetrags um $200 von Mitarbeiter 006 ab dem 15. Februar durch den übereinstimmenden Mitarbeiterdatensatz erklärt, der ab dem 1. Februar eine Erhöhung um $200 zeigt.
Redundante zusammengeführte Datensätze entfernen Je nach Beschaffenheit der zusammenzuführenden Daten können durch eine n:n-Zusammenführung redundante zusammengeführte Datensätze entstehen. Im obigen Beispiel enthielten einige der zusammengeführten Datensäte des Mitarbeiters 006 ungültige Kombinationen von Zahlungsdatum-Startdatum. Sie können einen Filter verwenden, um ungültige Kombinationen zu entfernen und für eine bessere Lesbarkeit der Ausgabetabelle zu sorgen:
Mitarb_Nr="004" OR Mitarb_Nr="005" OR (Mitarb_Nr="006" AND Zahldatum <= `20180131` AND Startdatum = `20150915`) OR (Mitarb_Nr="006" AND Zahldatum > `20180131` AND Startdatum = `20180201`)