Échantillonnage conditionnel

Attention

L'application de paramètres concernant le filtrage ou l'étendue des commandes lors de l'échantillonnage compromet la validité de l'échantillon. Si vous faites cela, une remarque indiquant que les résultats de l'échantillon puissent ne pas être valides est générée dans la trace.

Bien que la fonctionnalité permettant d'appliquer des paramètres de filtres de commande et d'étendue existe dans la boîte de dialogue Échantillonnage, les étapes ont été retirées des procédures d'échantillonnage de ce guide.

L'échantillonnage conditionnel est utilisé pour limiter la sélection de l'échantillon aux enregistrements répondant à une condition spécifiée, par exemple, à des transactions originaires d'un lieu particulier ou à des produits fabriqués par une entreprise spécifique.

Quand vous effectuez un échantillonnage conditionnel, vous devez vous assurer que vous utilisez un jeu de données exact. L'utilisation d'un filtre de commande pour affiner les données de l'échantillonnage peut renvoyer des résultats inattendus. Il est recommandé de commencer par extraire, dans une nouvelle table, les données répondant à la condition souhaitée, puis d'effectuer l'échantillonnage, sans utiliser de filtres, sur la nouvelle table.

Échantillonnage des données filtrées et filtrage des données échantillonnées : différences

Lorsque vous effectuez un échantillonnage conditionnel, soyez conscient de la différence entre :

  • l'échantillonnage des données filtrées
  • le filtrage des données échantillonnées

Bonne pratique : l'échantillonnage des données filtrées

Vous avez une table de 1000 enregistrements dont 150 répondent à la condition « Dept 03 ». Vous souhaitez extraire un échantillon de 10 enregistrements dans « Dept 03 ».

Le meilleur moyen d'atteindre votre objectif consiste d'abord à filtrer et à extraire les enregistrements de « Dept 03 » dans une nouvelle table avant d'extraire l'échantillon. Vous échantillonnez ensuite la nouvelle table pour pouvoir en extraire uniquement les enregistrements « Dept 03 ». À l'aide de cette méthode, vous échantillonnez des données filtrées.

À éviter : le filtrage des données échantillonnées

Vous avez une table de 1000 enregistrements dont 150 répondent à la condition « Dept 03 ». Vous souhaitez extraire un échantillon de 10 enregistrements dans « Dept 03 ».

Si vous extrayez l'échantillon de 10 enregistrements à partir de la table d'origine contenant 1000 enregistrements et qu'au cours du processus vous appliquez le filtre de commande IF Dept = "03", vous filtrez les données échantillonnées.

Le problème de cette méthode, c'est qu'Analytics sélectionne 10 enregistrements du jeu de données non filtrées, puis présente uniquement les enregistrements qui correspondent au « Dept 03 », ce qui aboutit à un nombre d'enregistrements inférieur aux 10 enregistrements requis dans l'échantillon. L'échantillon n'est pas représentatif et n'est pas valide.

Pour des raisons similaires, filtrer une table de sortie contenant les enregistrements échantillonnés rend l'échantillon non valide.

Aide d'Analytics 14.1