Analyse de données

« L'analyse des données » est un vaste concept qui englobe un large éventail de processus et de techniques différents. Il peut exister plusieurs façons d'atteindre le même objectif d'analyse de données. Le processus global est souvent itératif, ce qui exige que vous modifiiez votre approche initiale en fonction des informations que vous découvrez en cours de route.

Une analyse efficace des données

Initialement, l'analyse de données est le processus permettant de trouver des réponses aux questions sur les données. Analytics fournit des commandes et d'autres outils que vous pouvez utiliser afin d'avoir une vision générale des données que vous recherchez, et afin de répondre à des questions particulières. Cependant, vous devriez résister à l'idée qu'il suffit de cliquer sur deux ou trois boutons dans Analytics pour obtenir, comme par magie, toutes les réponses aux questions d'analyse de données que vous vous posez.

Une analyse efficace des données nécessite les points suivants :

  • bien comprendre la nature des données
  • formuler des objectifs d'analyse spécifiques
  • appliquer des outils en connaissance de cause

Analytics peut amplifier de manière significative vos capacités d'analyse de données, mais ne les remplace pas.

Commandes et outils d'analyse de données dans Analytics

Le tableau ci-dessous classe les commandes et outils Analytics par domaine d'analyse de données. Ces catégories ne sont pas destinées à être absolues. Il se peut que vous trouviez une utilisation efficace d'une commande en dehors de sa catégorie. L'objectif principal de certaines commandes, telles que Trier et Joindre, n'est pas avant tout analytique, mais dans certaines situations, elles peuvent fournir des informations analytiques.

Remarque

L'analyse des données, au-delà des plus élémentaires, nécessite généralement l'utilisation d'une série de commandes pour avancer progressivement vers votre objectif d'analyse, plutôt que l'utilisation d'une seule commande de manière isolée.

Domaine d'analyse des données Commande ou outil Description

Caractéristiques générales

Vérifier

Compte

Total

Profil

Statistiques

Valeurs aberrantes

Trier

Index

Utilisez ces commandes pour découvrir les caractéristiques générales d'un jeu de données, comme les éléments suivants :

  • validité des données
  • nombres d'enregistrements
  • montants totaux
  • montants minimum, maximum et moyen
  • valeurs des écart-type, médiane, mode et quartiles
  • valeurs aberrantes
  • plages
  • répartition des valeurs positives et négatives
  • modèles
Fiabilité/Précision champs calculés Utilisez des champs calculés pour recalculer et tester l'exactitude des montants calculés dans un jeu de données, comme les montants totaux taxes comprises.
Isolement

filtrage

recherche

Utilisez le filtrage pour limiter un jeu de données ou le traitement des données à un sous-ensemble d'enregistrements intéressant.

Utilisez la recherche pour localiser des valeurs spécifiques dans un jeu de données.

Ordre séquentiel Séquence Testez si les données sont classées de manière séquentielle et identifiez les éléments hors séquence.
Exhaustivité Omissions Vérifiez si tous les enregistrements d'une séquence, comme une série de vérifications classées de manière séquentielle, sont présents et identifiez l'emplacement des omissions dans la séquence.
Unicité Doublons Identifiez des valeurs ou des éléments en doublon dans un champ ou des doublons d'enregistrements entiers.
Inexactitude Doublons approximatifs Identifiez les valeurs de type caractère quasiment identiques susceptibles de faire référence à la même entité réelle.

Distribution de fréquence

Concentration du seuil de signification

Stratifier

Classement par antériorité

Classer

Totaliser

Tabulation croisée

Histogramme

Cluster

Regroupez les enregistrements et déterminez le nombre d'enregistrements et le nombre de valeurs concentrés par plage numérique ou par cluster, par période ou par identificateur d'enregistrement tels que les codes d'emplacement, les numéros de fournisseur/client ou les identificateurs de produit.

Également utile pour identifier les valeurs aberrantes

Comparer

Joindre

Jointure approximative

Associer

Combinez des tables pour découvrir si les enregistrements sont correspondants ou non correspondants entre les tables, comme une table de factures et une table de bons de commande
Anomalie numérique Benford Découvrez des données numériques anormales en testant les chiffres de tête pour déterminer la variance par rapport à la distribution de Benford prévue.