Combinaison de données

Analytics permet d'analyser les données d'une seule table à la fois. C'est pourquoi, il se peut que vous deviez combiner les données d'au moins deux tables en une table avant de réaliser votre analyse.

Analytics fournit les méthodes suivantes pour combiner des données :

Combiner des enregistrements Combiner des champs
  • Concaténer
  • Extraire/Ajouter
  • Fusionner
  • Joindre
  • Associer

La nature des données source ou de l'objectif de l'analyse détermine la méthode de combinaison de données à appliquer. Les cinq méthodes sont décrites brièvement ci-dessous.

Concaténer

Lorsque vous concaténez des tables, vous combinez des enregistrements provenant de plusieurs tables dans une nouvelle table qui contient tous les enregistrements des tables concaténées. Vous avez la possibilité d'inclure tous les champs des tables concaténées ou uniquement les champs communs.

Exemple

Scénario

Vous souhaitez effectuer une analyse sur les données d'une année complète, mais les données sont réparties entre douze tables de transactions mensuelles.

Approche

Vous concaténez les données des douze tables mensuelles en une table annuelle unique contenant l'ensemble des données, puis vous effectuez l'analyse.

Informations détaillées

Pour des informations détaillées, consultez la section Concaténation de tables.

Extraire/Ajouter

Lorsque vous extrayez et ajoutez des données, vous extrayez des enregistrements d'une table et les ajoutez à la fin d'une autre table. L'extraction est identique à la copie et l'ajout au collage.

Vous avez aussi la possibilité d'extraire un sous-ensemble des champs dans un enregistrement plutôt que l'enregistrement entier.

La table au niveau de laquelle s'effectue l'ajout (la table cible) augmente en taille. Une nouvelle table n'est pas créée.

Exemple

Scénario

Vous souhaitez effectuer l'analyse sur l'ensemble complet des enregistrements des employés, mais les enregistrements des nouveaux employés ne sont pas encore contenus dans la table maîtresse Employés.

Approche

Vous extrayez les enregistrements des nouveaux employés et vous les ajoutez à la fin de la table maîtresse Employés, puis vous effectuez l'analyse.

Informations détaillées

Pour des informations détaillées, consultez la section Extraction et ajout de données.

Fusionner

Lorsque vous fusionnez des tables, vous interclassez les enregistrements provenant de deux tables triées dans une nouvelle table, la troisième, également triée. L'interclassement consiste à combiner des enregistrements conformément à leur ordre de tri existant.

Exemple

Scénario

Vous souhaitez effectuer l'analyse sur l'ensemble complet des enregistrements des employés, mais les enregistrements sont divisés entre deux tables Employés de division.

Les deux tables sont triées par nom et vous souhaitez éviter les frais généraux liés au nouveau tri des enregistrements une fois qu'ils sont combinés.

Approche

Vous fusionnez les enregistrements des deux tables en une troisième table nouvelle. Le fait d'effectuer une fusion évite le tri par nom.

Informations détaillées

Pour des informations détaillées, consultez la section Fusion de tables.

Joindre

Lorsque vous joignez des tables, vous utilisez un champ clé commun pour intégrer des enregistrements ou une sélection de champs provenant de de deux tables vers une troisième. Un champ clé commun correspond à un champ d'identification, comme ID employé, qui figure dans les deux tables en cours de jonction.

Exemple

Scénario

Vous voulez identifier les fournisseurs qui sont également des employé via une seule méthode d'analyse des données afin de trouver d'éventuels paiements incorrects.

Approche

Vous joignez la table de base Fournisseur à celle Employé grâce au champ clé commun Adresse.

La table de sortie jointe contient les fournisseurs et les employés qui ont la même adresse.

Informations détaillées

Pour des informations détaillées, consultez la section Jonction de tables.

Associer

Lorsque vous liez des tables, vous joignez virtuellement jusqu'à 18 tables. Vous utilisez un champ clé commun pour lier chaque paire de tables.

Associer ou joindre virtuellement revient à créer une association programmatique temporaire entre des tables qui vous permet d'accéder aux données dans les tables comme si elles se trouvaient dans une seule table physique. Cependant, aucune table physique n'est créée et vous pouvez supprimer le lien aux tables sources à tout moment.

Un champ clé commun correspond à un champ d'identification, comme ID employé, qui figure dans chaque paire de tables en cours d'association. Généralement, vous utilisez un champ clé commun différent pour chaque paire de tables.

Exemple

Scénario

Vous voulez créer un rapport des ventes qui contient des détails sur les clients et les produits vendus au cours du mois de mars, mais les données sont réparties sur trois tables.

Approche

Vous associez la table maître Client à la table Commandes, et cette dernière a la table maître Produit, pour créer une association temporaire des tables contenant toutes les informations nécessaires au rapport :

  • l'emplacement et le nom du client depuis la table maître Client
  • le détail des commandes depuis la table Commandes
  • les détails du produit depuis la table maître Produit

Informations détaillées

Pour des informations détaillées, consultez la section Association de tables.

Quelle méthode de combinaison de données dois-je utiliser ?

Plusieurs facteurs sont à prendre en compte au moment de choisir une méthode de combinaison de données. Vous pouvez utiliser les instructions ci-dessous comme point de départ.

Utilisez... Si...
Concaténer
  • Vous souhaitez combiner plusieurs tables en faisant le moins d'effort possible.
  • Les enregistrements des tables source à combiner doivent être exactement identiques en termes de structure.
Extraire/Ajouter
  • Les enregistrements ou les champs des deux tables source doivent être très exactement identiques en termes de structure.
Fusionner
  • Les enregistrements des tables sources à fusionner doivent être exactement identiques en termes de structure.
  • Les deux tables sources sont triées à l'aide d'un ordre de tri identique.

Astuce

L'exécution correcte d'une fusion peut s'avérer délicate. Vous pouvez obtenir le même résultat en procédant à une concaténation, à une extraction et à un ajout, puis à un tri des données.

Si les deux tables sources sont déjà triées, la fusion est plus efficace et peut s'opérer plus rapidement.

Joindre
  • Les enregistrements disponibles dans les deux tables sources ont des structures d'enregistrement différentes.
  • Vous souhaitez inclure ou exclure des enregistrements selon des valeurs avec ou sans correspondance dans un champ clé commun.
  • Vous exécuter une analyse d'enquête qui exige une table jointe, physique.
Associer
  • Vous voulez associer, ou joindre virtuellement jusqu'à 18 tables contenant différentes structures d'enregistrement.
  • Vous souhaitez inclure ou exclure des enregistrements selon des valeurs avec ou sans correspondance dans des champs clés communs.
  • Vous n'avez pas à sortir les données combinées dans une nouvelle table.
  • Vous réalisez un travail informationnel, comme le reporting, qui ne demande qu'une association temporaire entre les tables.

Astuce

Si nécessaire, une fois les tables associées, vous pouvez effectuer une opération distincte et extraire une combinaison de champs des tables associées vers une nouvelle table.

Structure de données

Lorsque vous combinez des données, la méthode que vous choisissez dépend souvent de la manière dont les données source sont structurées. La structure de données, ou structure d'enregistrement, fait référence aux éléments de données contenus dans un enregistrement, au type de données, à la longueur des champs ainsi qu'au nombre et à l'ordre des colonnes.

Pour de plus amples informations sur la structure de données, consultez la section Conditions requises pour la structure et le format des données.

Vous pouvez être amené à essayer

Dans certaines situations, il n'est pas immédiatement évident de savoir quelle méthode utiliser pour combiner des données. Vous pouvez tester un petit sous-ensemble de données afin de déterminer la méthode qui convient le mieux à la tâche que vous voulez effectuer.

L'utilisation d'un petit sous-ensemble permet d'éviter les longues durées de traitement associées aux tables volumineuses et facilite également la visualisation des modèles.

Utiliser plusieurs méthodes de combinaison de données pour atteindre votre objectif.

Vous pouvez être amené à gérer des situations de combinaisons de données complexes qui impliquent plusieurs tables. Vous commencez par utiliser une méthode de combinaison de données puis une deuxième avec les résultats sortis de la première méthode.

Exemple

  1. Vous commencez par compiler une table de transactions annuelle en combinant des tables de transactions mensuelles.
  2. Vous utilisez ensuite un champ clé commun comme un ID client pour joindre la table de transactions annuelle avec une table de base qui contient des données telles que le nom de client.