Prüfen auf Duplikate

Doppelte Werte in ein oder mehreren Feldern oder doppelte Datensätze können sich aus Dateneingabefehlern oder betrügerischen Aktivitäten ergeben, wie z.B. die Aufspaltung von Kreditkartentransaktionen zur Vermeidung einer genaueren Überprüfung.

Anforderung eindeutiger Werte

Felder, die niemals Duplikate enthalten sollten, kennzeichnen Datensätze durch ihre Werte eindeutig. Beispiel: Eine Mitarbeitertabelle sollte nie doppelte Mitarbeiternummern enthalten, da jeder Wert einen Mitarbeiter eindeutig kennzeichnen sollte.

Gültige Duplikate

Doppelte Werte können auch gültig sein. Beispiel: Eine Transaktionstabelle enthält möglicherweise doppelte Kundennummern aufgrund von wiederholten Transaktionen durch denselben Kunden.

Verschiedene Arten, auf Duplikate zu testen

Verwenden Sie Analytics, um auf die folgende Weise nach Duplikaten zu suchen:

Testbereich Verwenden Sie diesen Test in folgender Situation:
Ein Feld

Alle Werte eines bestimmten Felds sollten eindeutig sein, wie zum Beispiel Mitarbeiternummern oder Schecknummern.

Zwei oder mehr Felder kombiniert

Keines der Felder muss selbst eindeutige Werte aufweisen, dies ist jedoch für die Kombination bestimmter Felder notwendig.

Beispiel

In einer Lohnabrechnungsdatei eines Jahres enthält sowohl das Feld „Mitarbeiternummer“ als auch das Feld „Zahlungsdatum“ zahlreiche Duplikate. Mitarbeiter werden alle zwei Wochen bezahlt und viele Mitarbeiter erhalten ihre Zahlung an demselben Tag.

Ein einzelner Mitarbeiter sollte jedoch an einem bestimmten Datum nur einmal auftauchen. Wenn ein Duplikat für die Kombination aus Mitarbeiternummer und Zahlungsdatum vorhanden ist, wurde ein Mitarbeiter möglicherweise zweimal in derselben Zahlungsperiode bezahlt.

Alle Felder eines Datensatzes

Sie suchen nach doppelten Datensätzen, in denen also jedes Feld eines Datensatzes doppelt vorhanden ist. Doppelte Datensätze können aus Dateneingabefehlern oder sonstigen Unregelmäßigkeiten auf Transaktionsebene entstehen.

Schritte

Sie können ein oder mehrere Felder in der aktiven Tabelle auf doppelte Werte oder doppelte Datensätze prüfen.

Duplikate entfernen

Sie können den Befehl „Summenstruktur“ verwenden, um doppelt vorhandene Datensätze aus einem Dataset zu entfernen und die verbleibenden eindeutigen Werte bzw. Datensätze in einer neuen Analytics-Tabelle zu speichern.

Hilfe für Analytics 14.1