Commande SAMPLE

Extrait un échantillon d'enregistrements à l'aide de la méthode d'échantillonnage par enregistrement ou par unité monétaire.

Syntaxe

Remarque

Cette syntaxe n'inclut pas les paramètres de filtrage (instructions IF) ou d'étendue car l'application de ces options compromet la validité d'un échantillon.

Méthode de sélection par intervalle fixe

SAMPLE <ON> RECORD INTERVAL valeur_intervalle <FIXED valeur_initiale> {RECORD|FIELDS nom_champ <...n>} TO nom_table <OPEN> <APPEND> <LOCAL>

Méthode de sélection par cellule

SAMPLE <ON> RECORD CELL INTERVAL valeur_intervalle <RANDOM valeur_départ> {RECORD|FIELDS nom_champ <...n>} TO nom_table <OPEN> <APPEND> <MERSENNE_TWISTER> <LOCAL>

Méthode de sélection aléatoire

SAMPLE <ON> RECORD NUMBER taille_échantillon <RANDOMvaleur_départ ><ORDER> {RECORD|FIELDS nom_champ <...n>} TO nom_table <OPEN> <APPEND> <MERSENNE_TWISTER> <LOCAL>

Paramètres

Remarque

N'incluez pas les séparateurs des milliers lorsque vous saisissez des valeurs.

Nom Description
ON RECORD Utilisez l'échantillonnage par enregistrement.
INTERVAL valeur_intervalle FIXED valeur_initiale | CELL INTERVAL valeur_intervalle | NUMBER taille_échantillon

INTERVAL valeur_intervalle FIXED valeur_initiale

Utilisez la méthode de sélection par intervalle fixe.

Un enregistrement initial est sélectionné, et toutes les sélections suivantes sont séparées d'un intervalle ou d'une distance fixe : par exemple, tous les 20 enregistrements à partir de la première sélection.

  • INTERVAL valeur_intervalle indiquez la valeur d'intervalle générée en calculant la taille de l'échantillon
  • FIXED valeur_initiale indiquez le numéro de l'enregistrement initial sélectionné

    Si vous indiquez une valeur_initiale de zéro ('0') ou si vous omettez FIXED, Analytics sélectionne de manière aléatoire l'enregistrement initial.

CELL INTERVAL valeur_intervalle

Utilisez la méthode de sélection des cellules.

Le jeu de données est divisé en plusieurs cellules ou groupes de taille égale, et un enregistrement est sélectionné de façon aléatoire dans chaque cellule.

La valeur_intervalle détermine la taille de chaque cellule. Indiquez la valeur d'intervalle générée en calculant la taille de l'échantillon.

NUMBER taille_échantillon

Utilisez la méthode de sélection aléatoire.

Tous les enregistrements sont sélectionnés de manière aléatoire dans le jeu de données complet.

Indiquez la taille d'échantillon générée en calculant la taille de l'échantillon.

RANDOM valeur_départ

optionnel

Remarque

Méthodes de sélection aléatoire et par cellule uniquement.

Valeur de départ à utiliser pour lancer le générateur de nombres aléatoires dans Analytics.

Si vous spécifiez une valeur de zéro (« 0 ») ou si vous omettez RANDOM, Analytics sélectionne la valeur de départ.

ORDER

optionnel

Remarque

Méthode de sélection aléatoire uniquement.

Vous pouvez uniquement utiliser ORDER lorsque vous spécifiez FIELDS.

Ajoute le champ ORDER aux résultats de la sortie.

Ce champ affiche l'ordre dans lequel chaque enregistrement est sélectionné de façon aléatoire.

RECORD | FIELDS nom_champ <...n>
  • RECORD l'intégralité de l'enregistrement est incluse dans la table de sortie
  • FIELDS les champs individuels, plutôt que l'enregistrement entier, sont inclus dans la table de sortie

    Indiquez le(s) champ(s) ou expressions à inclure. Si vous indiquez plusieurs champs, ils doivent être séparés par des espaces.

TO nom_table

Emplacement vers lequel envoyer les résultats de la commande :

  • nom_table enregistre les résultats dans une table Analytics

    Indiquez nom_table sous forme de chaîne entre guillemets avec une extension de fichier .FIL. Par exemple : TO "Sortie.FIL"

    Par défaut, le fichier de données de table (.FIL) est enregistré dans le dossier contenant le projet Analytics.

    Utilisez un chemin de fichier absolu ou relatif pour enregistrer le fichier de données dans un autre dossier existant :

    • TO "C:\Sortie.FIL"
    • TO "Résultats\Sortie.FIL"

    Remarque

    La longueur des noms des tables est limitée à 64 caractères alphanumériques, sans l'extension .FIL. Le nom peut inclure le caractère de soulignement ( _ ), mais aucun autre caractère spécial ni espace. Le nom ne peut pas commencer par un chiffre.

OPEN

optionnel

Ouvre la table créée par la commande après l'exécution de la commande. Valide uniquement lorsque la commande crée une table de sortie.

APPEND

optionnel

Ajoute la sortie de commande à la fin d'un fichier existant au lieu de remplacer ce fichier.

Remarque

Vous devez vous assurer que la structure de la sortie de la commande et du fichier existant est identique :

  • les mêmes champs
  • le même ordre des champs
  • les champs correspondants ont la même longueur
  • les champs correspondants ont le même type de données

Analytics ajoute la sortie à un fichier existant sans tenir compte de sa structure, ce qui peut désordonner les données si la structure de la sortie et du fichier existant ne correspond pas.

MERSENNE_TWISTER

optionnel

Remarque

Méthodes de sélection aléatoire et par cellule uniquement.

Le générateur de nombres aléatoires d'Analytics utilise l'algorithme Mersenne-Twister.

Si vous ignorez MERSENNE_TWISTER, l'algorithme d'Analytics par défaut est utilisé.

Remarque

Vous devez uniquement utiliser l'algorithme Analytics par défaut si vous avez besoin d'une rétrocompatibilité avec les scripts Analytics ou les résultats d'échantillonnage créés avant Analytics version 12.

LOCAL

optionnel

Enregistre le fichier de sortie au même emplacement que le projet Analytics.

Remarque

Applicable uniquement lorsque vous exécutez la commande sur une table de serveur avec un fichier de sortie qui est une table Analytics.

Exemples

Extraire un échantillon d'enregistrements

Vous allez utiliser l'échantillonnage par enregistrement pour estimer le taux d'écart par rapport au contrôle prescrit dans un compte contenant des factures.

Après avoir calculé une taille d'échantillon statistiquement valide, vous voilà prêt à extraire l'échantillon. Vous allez utiliser la méthode de sélection aléatoire.

L'exemple ci-dessous :

  • Échantillonne la table Analytics ouverte
  • Utilise la méthode de sélection aléatoire avec une valeur de départ de 123456
  • Spécifie une taille d'échantillon de 95 enregistrements
  • Inclut uniquement les champs spécifiés dans la table de sortie
  • Indique que le générateur de nombres aléatoires d'Analytics utilise l'algorithme Mersenne-Twister
SAMPLE ON RECORD RANDOM 123456 NUMBER 95 FIELDS RefNum CustNum Amount Date Type TO "C_échantillon_enregistrement" OPEN MERSENNE_TWISTER

Remarques

Remarque

Pour plus d'informations sur le fonctionnement de cette commande, consultez le Aide d'Analytics.

Syntaxe

Remarque

Cette syntaxe n'inclut pas les paramètres de filtrage (instructions IF) ou d'étendue car l'application de ces options compromet la validité d'un échantillon.

Méthode de sélection par intervalle fixe

SAMPLE <ON> champ_numérique_mus INTERVAL valeur_intervalle <FIXED valeur_initiale> <CUTOFF valeur_limite_couche_supérieure> <SUBSAMPLE> <NOREPLACEMENT> {RECORD|FIELDS nom_champ <...n>} TO nom_table <OPEN> <APPEND> <LOCAL>

Méthode de sélection par cellule

SAMPLE <ON> champ_numérique_mus CELL INTERVAL intervalle_valeur <CUTOFF valeur_limite_couche_supérieure> <RANDOM valeur_départ> <NOREPLACEMENT> {RECORD|FIELDS nom_champ <...n>} TO nom_table <OPEN> <APPEND> <MERSENNE_TWISTER> <LOCAL>

Méthode de sélection aléatoire

SAMPLE <ON> champ_numérique_mus NUMBER taille_échantillon POPULATION valeur_absolue <RANDOM valeur_départ> <SUBSAMPLE> <NOREPLACEMENT> {RECORD|FIELDS nom_champ <...n>} TO nom_table <OPEN> <APPEND> <MERSENNE_TWISTER> <LOCAL>

Paramètres

Remarque

N'incluez pas les séparateurs des milliers lorsque vous saisissez des valeurs.

Nom Description
ON champ_numérique_mus

Utilisez l'échantillonnage par unité monétaire (MUS).

champ_numérique_mus est le champ ou l'expression numérique à utiliser comme base pour l'échantillonnage.

INTERVAL valeur_intervalle FIXED valeur_initiale | CELL INTERVAL valeur_intervalle | NUMBER taille_échantillon POPULATION valeur_absolue

INTERVAL valeur_intervalle FIXED valeur_initiale

Utilisez la méthode de sélection par intervalle fixe.

Une unité monétaire initiale est sélectionnée, et toutes les sélections suivantes sont séparées d'un intervalle ou d'une distance fixe : par exemple, toutes les 5000 unités monétaires à partir de la première sélection.

  • INTERVAL valeur_intervalle indiquez la valeur d'intervalle générée en calculant la taille de l'échantillon
  • FIXED valeur_initiale indiquez l'unité monétaire initiale sélectionnée

    Si vous indiquez une valeur_initiale de zéro ('0') ou si vous omettez FIXED, Analytics sélectionne de manière aléatoire l'unité monétaire initiale.

CELL INTERVAL valeur_intervalle

Utilisez la méthode de sélection des cellules.

Le jeu de données est divisé en plusieurs cellules ou groupes de taille égale, et une unité monétaire est sélectionnée de façon aléatoire dans chaque cellule.

La valeur_intervalle détermine la taille de chaque cellule. Indiquez la valeur d'intervalle générée en calculant la taille de l'échantillon.

NUMBER taille_échantillon POPULATION valeur_absolue

Utilisez la méthode de sélection aléatoire.

Toutes les unités monétaires sont sélectionnées de manière aléatoire dans le jeu de données complet.

  • NUMBER taille_échantillon indiquez la taille d'échantillon générée en calculant la taille de l'échantillon.
  • POPULATION valeur_absolue indiquez la valeur absolue totale du champ_numérique_mus ; elle correspond à la population dans laquelle l'échantillon sera sélectionné.
CUTOFF valeur_limite_couche_supérieure

optionnel

Remarque

Méthodes de sélection à intervalle fixe et par sélection des cellules uniquement.

Valeur limite de la couche supérieure.

Les montants dans champ_numérique_mus qui sont supérieurs ou égaux à la valeur limite sont sélectionnés et inclus automatiquement dans l'échantillon.

Si vous ignorez CUTOFF, une valeur limite par défaut égale à la valeur_intervalle est utilisée.

RANDOM valeur_départ

optionnel

Remarque

Méthodes de sélection aléatoire et par cellule uniquement.

Valeur de départ à utiliser pour lancer le générateur de nombres aléatoires dans Analytics.

Si vous spécifiez une valeur de zéro (« 0 ») ou si vous omettez RANDOM, Analytics sélectionne la valeur de départ.

SUBSAMPLE

optionnel

Remarque

Vous pouvez uniquement utiliser SUBSAMPLE lorsque vous spécifiez FIELDS.

Ajoute le champ SUBSAMPLE aux résultats de la sortie.

Si chaque montant d'un champ de l'échantillon représente un total de plusieurs transactions distinctes et que vous souhaitez effectuer des procédures d'audit sur une seule transaction de chaque montant total échantillonné, vous pouvez utiliser les valeurs du champ SUBSAMPLE pour sélectionner de façon aléatoire les transactions individuelles.

Pour plus d'informations, consultez la rubrique Réalisation d'un échantillonnage par unité monétaire.

NOREPLACEMENT

optionnel

Le même enregistrement n'est pas sélectionné plusieurs fois. Par conséquent, l'échantillon peut contenir moins d'enregistrements que le nombre calculé par la commande SIZE.

Si NOREPLACEMENT est omis ou si vous spécifiez REPLACEMENT, les enregistrements peuvent être sélectionnés plusieurs fois.

ORDER

optionnel

Remarque

Méthode de sélection aléatoire uniquement.

Vous pouvez uniquement utiliser ORDER lorsque vous spécifiez FIELDS.

Ajoute le champ ORDER aux résultats de la sortie.

Ce champ affiche l'ordre dans lequel chaque enregistrement est sélectionné de façon aléatoire.

RECORD | FIELDS nom_champ <...n>
  • RECORD l'intégralité de l'enregistrement est incluse dans la table de sortie
  • FIELDS les champs individuels, plutôt que l'enregistrement entier, sont inclus dans la table de sortie

    Indiquez le(s) champ(s) ou expressions à inclure. Si vous indiquez plusieurs champs, ils doivent être séparés par des espaces.

TO nom_table

Emplacement vers lequel envoyer les résultats de la commande :

  • nom_table enregistre les résultats dans une table Analytics

    Indiquez nom_table sous forme de chaîne entre guillemets avec une extension de fichier .FIL. Par exemple : TO "Sortie.FIL"

    Par défaut, le fichier de données de table (.FIL) est enregistré dans le dossier contenant le projet Analytics.

    Utilisez un chemin de fichier absolu ou relatif pour enregistrer le fichier de données dans un autre dossier existant :

    • TO "C:\Sortie.FIL"
    • TO "Résultats\Sortie.FIL"

    Remarque

    La longueur des noms des tables est limitée à 64 caractères alphanumériques, sans l'extension .FIL. Le nom peut inclure le caractère de soulignement ( _ ), mais aucun autre caractère spécial ni espace. Le nom ne peut pas commencer par un chiffre.

OPEN

optionnel

Ouvre la table créée par la commande après l'exécution de la commande. Valide uniquement lorsque la commande crée une table de sortie.

APPEND

optionnel

Ajoute la sortie de commande à la fin d'un fichier existant au lieu de remplacer ce fichier.

Remarque

Vous devez vous assurer que la structure de la sortie de la commande et du fichier existant est identique :

  • les mêmes champs
  • le même ordre des champs
  • les champs correspondants ont la même longueur
  • les champs correspondants ont le même type de données

Analytics ajoute la sortie à un fichier existant sans tenir compte de sa structure, ce qui peut désordonner les données si la structure de la sortie et du fichier existant ne correspond pas.

MERSENNE_TWISTER

optionnel

Remarque

Méthodes de sélection aléatoire et par cellule uniquement.

Le générateur de nombres aléatoires d'Analytics utilise l'algorithme Mersenne-Twister.

Si vous ignorez MERSENNE_TWISTER, l'algorithme d'Analytics par défaut est utilisé.

Remarque

Vous devez uniquement utiliser l'algorithme Analytics par défaut si vous avez besoin d'une rétrocompatibilité avec les scripts Analytics ou les résultats d'échantillonnage créés avant Analytics version 12.

LOCAL

optionnel

Enregistre le fichier de sortie au même emplacement que le projet Analytics.

Remarque

Applicable uniquement lorsque vous exécutez la commande sur une table de serveur avec un fichier de sortie qui est une table Analytics.

Exemples

Extraire un échantillon par unité monétaire

Vous allez utiliser un échantillonnage par unité monétaire pour estimer le montant total d'anomalie monétaire dans un compte contenant des factures.

Après avoir calculé une taille d'échantillon statistiquement valide, vous voilà prêt à extraire l'échantillon. Vous allez utiliser la méthode de sélection par intervalle fixe.

L'exemple ci-dessous :

  • Échantillonne la table Analytics ouverte à partir d'un champ Montant des transactions
  • Utilise la méthode de sélection à intervalle fixe avec une valeur d'intervalle de 6 283,33 €
  • Indique que le premier enregistrement sélectionné contient la 100 000e unité monétaire (le nombre de centimes dans 1 000 €)
  • Utilise une limite de couche supérieure de 5 000 €
  • Inclut l'intégralité de l'enregistrement dans la table de sortie
SAMPLE ON Amount INTERVAL 6283.33 FIXED 1000.00 CUTOFF 5000.00 RECORD TO "C_échantillon_unité_monétaire" OPEN

Remarques

Remarque

Pour plus d'informations sur le fonctionnement de cette commande, consultez le Aide d'Analytics.

Guide de création de scripts ACL 14.1