Préparation des données pour analyse

Il se peut que vous deviez effectuer un travail préparatoire initial sur les données que vous avez l'intention d'analyser. Dans certains cas, vous pouvez commencer à analyser les données dès leur importation. Toutefois, bien souvent, il vous faudra effectuer une ou plusieurs tâches préparatoires afin de :

  • modeler le jeu de données que vous analyserez à terme
  • vérifier que les résultats sont fiables

Envisagez la préparation comme le fondement de la construction de votre analyse. Il est essentiel de disposer d'une bonne base pour obtenir des résultats fiables et efficaces.

Tâches de préparation courantes

Voici quelques-unes des tâches de préparation les plus courantes :

  • convertir permet de convertir le type de données des champs afin qu'ils puissent être utilisés comme entrée pour des commandes Analytics spécifiques ou s'harmoniser avec les autres champs
  • nettoyer et normaliser permet de nettoyer et de normaliser les données d'entrée afin que les résultats de sortie soient fiables
  • combiner permet de combiner les données de plusieurs tables
  • échantillonner permet d'extraire un échantillon d'enregistrements car vous n'avez peut-être pas le temps ni le budget nécessaire pour examiner chaque enregistrement dans un grand jeu de données

Chacune de ces tâches pourrait correspondre à une première étape indispensable avant d'effectuer l'analyse prévue.

Vérification des données

En plus de préparer les données, il est également recommandé de vérifier l'exhaustivité et la validité des données que vous allez analyser. Même une petite quantité de données incorrectes peut invalider toutes vos analyses ultérieures et vous faire perdre du temps et des ressources utiles.