Recherche de doublons

Les doublons dans un ou plusieurs champs, ou les enregistrements dupliqués, peuvent être le résultat d'erreurs d'entrée de données ou d'activité frauduleuse comme la ventilation des transactions par carte de crédit pour éviter tout examen approfondi.

Conditions requises pour les valeurs uniques

Les champs qui ne doivent jamais contenir de doublons sont ceux dans lesquels les valeurs identifient les enregistrements de façon unique. Par exemple, une table d'employés ne doit jamais contenir de numéros d'employés en doublons, car chaque numéro doit identifier un employé unique.

Doublons valides

Les valeurs en doublons peuvent aussi être valides. Par exemple, une table de transactions peut contenir des numéros clients en doublons suite à plusieurs transactions effectuées par les mêmes clients.

Différents types de tests de doublons

Vous pouvez utiliser Analytics pour tester la recherche de doublons des façons suivantes :

Champ d'application des tests Utilisez ce test dans les cas suivants :
Sur un seul champ

Toutes les valeurs d'un champ particulier doivent être uniques, comme les numéros d'employés ou les numéros de chèque.

Avec au moins deux champs associés

L'unicité n'est pas une condition préalable dans des champs pris isolément, mais il s'agit d'une condition préalable dans certains champs associés.

Exemple

Dans un fichier de paie concernant une année, le champ de numéro d'employé et le champ de date de paie vont contenir plusieurs doublons. Les employés reçoivent leur paie toutes les deux semaines ; plusieurs employés sont payés à la même date.

Toutefois, chaque employé doit uniquement apparaître une fois à une date donnée. En cas de doublon entre les champs combinés Numéro de l'employé et Date de règlement, il se peut qu'un employé ait été payé deux fois pour la même période de paie.

Tous les champs d'un enregistrement

Recherchez la présence de doublons dans des enregistrements entièrement dupliqués, dans lesquels chaque champ d'un enregistrement est dupliqué. Des enregistrements entièrement dupliqués peuvent apparaître suite à une erreur d'entrée de données ou suite à d'autres irrégularités de transaction.

Étapes

Vous pouvez tester un ou plusieurs champs de la table active afin de déterminer s'il existe des doublons au niveau des valeurs ou d'enregistrements entiers.

Supprimer des doublons

Vous pouvez utiliser l'opération de totalisation pour supprimer les doublons de valeurs ou d'enregistrements d'un jeu de données et enregistrer les valeurs ou enregistrements uniques restants dans une nouvelle table Analytics.

Aide d'Analytics 14.1