Commande SAMPLE
Extrait un échantillon d'enregistrements à l'aide de la méthode d'échantillonnage par enregistrement ou par unité monétaire.
Syntaxe
Remarque
Cette syntaxe n'inclut pas les paramètres de filtrage (instructions IF) ou d'étendue car l'application de ces options compromet la validité d'un échantillon.
Méthode de sélection par intervalle fixe
SAMPLE <ON> RECORD INTERVAL valeur_intervalle <FIXED valeur_initiale> {RECORD|FIELDS nom_champ <...n>} TO nom_table <OPEN> <APPEND> <LOCAL>
Méthode de sélection par cellule
SAMPLE <ON> RECORD CELL INTERVAL valeur_intervalle <RANDOM valeur_départ> {RECORD|FIELDS nom_champ <...n>} TO nom_table <OPEN> <APPEND> <MERSENNE_TWISTER> <LOCAL>
Méthode de sélection aléatoire
SAMPLE <ON> RECORD NUMBER taille_échantillon <RANDOMvaleur_départ ><ORDER> {RECORD|FIELDS nom_champ <...n>} TO nom_table <OPEN> <APPEND> <MERSENNE_TWISTER> <LOCAL>
Paramètres
Remarque
N'incluez pas les séparateurs des milliers lorsque vous saisissez des valeurs.
Nom | Description |
---|---|
ON RECORD | Utilisez l'échantillonnage par enregistrement. |
INTERVAL valeur_intervalle FIXED valeur_initiale | CELL INTERVAL valeur_intervalle | NUMBER taille_échantillon |
INTERVAL valeur_intervalle FIXED valeur_initialeUtilisez la méthode de sélection par intervalle fixe. Un enregistrement initial est sélectionné, et toutes les sélections suivantes sont séparées d'un intervalle ou d'une distance fixe : par exemple, tous les 20 enregistrements à partir de la première sélection.
CELL INTERVAL valeur_intervalleUtilisez la méthode de sélection des cellules. Le jeu de données est divisé en plusieurs cellules ou groupes de taille égale, et un enregistrement est sélectionné de façon aléatoire dans chaque cellule. La valeur_intervalle détermine la taille de chaque cellule. Indiquez la valeur d'intervalle générée en calculant la taille de l'échantillon. NUMBER taille_échantillonUtilisez la méthode de sélection aléatoire. Tous les enregistrements sont sélectionnés de manière aléatoire dans le jeu de données complet. Indiquez la taille d'échantillon générée en calculant la taille de l'échantillon. |
RANDOM valeur_départ optionnel |
Remarque Méthodes de sélection aléatoire et par cellule uniquement. Valeur de départ à utiliser pour lancer le générateur de nombres aléatoires dans Analytics. Si vous spécifiez une valeur de zéro (« 0 ») ou si vous omettez RANDOM, Analytics sélectionne la valeur de départ. |
ORDER optionnel |
Remarque Méthode de sélection aléatoire uniquement. Vous pouvez uniquement utiliser ORDER lorsque vous spécifiez FIELDS. Ajoute le champ ORDER aux résultats de la sortie. Ce champ affiche l'ordre dans lequel chaque enregistrement est sélectionné de façon aléatoire. |
RECORD | FIELDS nom_champ <...n> |
|
TO nom_table |
Emplacement vers lequel envoyer les résultats de la commande :
|
OPEN optionnel |
Ouvre la table créée par la commande après l'exécution de la commande. Valide uniquement lorsque la commande crée une table de sortie. |
APPEND optionnel |
Ajoute la sortie de commande à la fin d'un fichier existant au lieu de remplacer ce fichier. Remarque Vous devez vous assurer que la structure de la sortie de la commande et du fichier existant est identique :
Analytics ajoute la sortie à un fichier existant sans tenir compte de sa structure, ce qui peut désordonner les données si la structure de la sortie et du fichier existant ne correspond pas. |
MERSENNE_TWISTER optionnel |
Remarque Méthodes de sélection aléatoire et par cellule uniquement. Le générateur de nombres aléatoires d'Analytics utilise l'algorithme Mersenne-Twister. Si vous ignorez MERSENNE_TWISTER, l'algorithme d'Analytics par défaut est utilisé. Remarque Vous devez uniquement utiliser l'algorithme Analytics par défaut si vous avez besoin d'une rétrocompatibilité avec les scripts Analytics ou les résultats d'échantillonnage créés avant Analytics version 12. |
LOCAL optionnel |
Enregistre le fichier de sortie au même emplacement que le projet Analytics. Remarque Applicable uniquement lorsque vous exécutez la commande sur une table de serveur avec un fichier de sortie qui est une table Analytics. |
Exemples
Extraire un échantillon d'enregistrements
Vous allez utiliser l'échantillonnage par enregistrement pour estimer le taux d'écart par rapport au contrôle prescrit dans un compte contenant des factures.
Après avoir calculé une taille d'échantillon statistiquement valide, vous voilà prêt à extraire l'échantillon. Vous allez utiliser la méthode de sélection aléatoire.
L'exemple ci-dessous :
- Échantillonne la table Analytics ouverte
- Utilise la méthode de sélection aléatoire avec une valeur de départ de 123456
- Spécifie une taille d'échantillon de 95 enregistrements
- Inclut uniquement les champs spécifiés dans la table de sortie
- Indique que le générateur de nombres aléatoires d'Analytics utilise l'algorithme Mersenne-Twister
SAMPLE ON RECORD RANDOM 123456 NUMBER 95 FIELDS RefNum CustNum Amount Date Type TO "C_échantillon_enregistrement" OPEN MERSENNE_TWISTER
Remarques
Remarque
Pour plus d'informations sur le fonctionnement de cette commande, consultez le Aide d'Analytics.
Syntaxe
Remarque
Cette syntaxe n'inclut pas les paramètres de filtrage (instructions IF) ou d'étendue car l'application de ces options compromet la validité d'un échantillon.
Méthode de sélection par intervalle fixe
SAMPLE <ON> champ_numérique_mus INTERVAL valeur_intervalle <FIXED valeur_initiale> <CUTOFF valeur_limite_couche_supérieure> <SUBSAMPLE> <NOREPLACEMENT> {RECORD|FIELDS nom_champ <...n>} TO nom_table <OPEN> <APPEND> <LOCAL>
Méthode de sélection par cellule
SAMPLE <ON> champ_numérique_mus CELL INTERVAL intervalle_valeur <CUTOFF valeur_limite_couche_supérieure> <RANDOM valeur_départ> <NOREPLACEMENT> {RECORD|FIELDS nom_champ <...n>} TO nom_table <OPEN> <APPEND> <MERSENNE_TWISTER> <LOCAL>
Méthode de sélection aléatoire
SAMPLE <ON> champ_numérique_mus NUMBER taille_échantillon POPULATION valeur_absolue <RANDOM valeur_départ> <SUBSAMPLE> <NOREPLACEMENT> {RECORD|FIELDS nom_champ <...n>} TO nom_table <OPEN> <APPEND> <MERSENNE_TWISTER> <LOCAL>
Paramètres
Remarque
N'incluez pas les séparateurs des milliers lorsque vous saisissez des valeurs.
Nom | Description |
---|---|
ON champ_numérique_mus |
Utilisez l'échantillonnage par unité monétaire (MUS). champ_numérique_mus est le champ ou l'expression numérique à utiliser comme base pour l'échantillonnage. |
INTERVAL valeur_intervalle FIXED valeur_initiale | CELL INTERVAL valeur_intervalle | NUMBER taille_échantillon POPULATION valeur_absolue |
INTERVAL valeur_intervalle FIXED valeur_initialeUtilisez la méthode de sélection par intervalle fixe. Une unité monétaire initiale est sélectionnée, et toutes les sélections suivantes sont séparées d'un intervalle ou d'une distance fixe : par exemple, toutes les 5000 unités monétaires à partir de la première sélection.
CELL INTERVAL valeur_intervalleUtilisez la méthode de sélection des cellules. Le jeu de données est divisé en plusieurs cellules ou groupes de taille égale, et une unité monétaire est sélectionnée de façon aléatoire dans chaque cellule. La valeur_intervalle détermine la taille de chaque cellule. Indiquez la valeur d'intervalle générée en calculant la taille de l'échantillon. NUMBER taille_échantillon POPULATION valeur_absolueUtilisez la méthode de sélection aléatoire. Toutes les unités monétaires sont sélectionnées de manière aléatoire dans le jeu de données complet.
|
CUTOFF valeur_limite_couche_supérieure optionnel |
Remarque Méthodes de sélection à intervalle fixe et par sélection des cellules uniquement. Valeur limite de la couche supérieure. Les montants dans champ_numérique_mus qui sont supérieurs ou égaux à la valeur limite sont sélectionnés et inclus automatiquement dans l'échantillon. Si vous ignorez CUTOFF, une valeur limite par défaut égale à la valeur_intervalle est utilisée. |
RANDOM valeur_départ optionnel |
Remarque Méthodes de sélection aléatoire et par cellule uniquement. Valeur de départ à utiliser pour lancer le générateur de nombres aléatoires dans Analytics. Si vous spécifiez une valeur de zéro (« 0 ») ou si vous omettez RANDOM, Analytics sélectionne la valeur de départ. |
SUBSAMPLE optionnel |
Remarque Vous pouvez uniquement utiliser SUBSAMPLE lorsque vous spécifiez FIELDS. Ajoute le champ SUBSAMPLE aux résultats de la sortie. Si chaque montant d'un champ de l'échantillon représente un total de plusieurs transactions distinctes et que vous souhaitez effectuer des procédures d'audit sur une seule transaction de chaque montant total échantillonné, vous pouvez utiliser les valeurs du champ SUBSAMPLE pour sélectionner de façon aléatoire les transactions individuelles. Pour plus d'informations, consultez la rubrique Réalisation d'un échantillonnage par unité monétaire. |
NOREPLACEMENT optionnel |
Le même enregistrement n'est pas sélectionné plusieurs fois. Par conséquent, l'échantillon peut contenir moins d'enregistrements que le nombre calculé par la commande SIZE. Si NOREPLACEMENT est omis ou si vous spécifiez REPLACEMENT, les enregistrements peuvent être sélectionnés plusieurs fois. |
ORDER optionnel |
Remarque Méthode de sélection aléatoire uniquement. Vous pouvez uniquement utiliser ORDER lorsque vous spécifiez FIELDS. Ajoute le champ ORDER aux résultats de la sortie. Ce champ affiche l'ordre dans lequel chaque enregistrement est sélectionné de façon aléatoire. |
RECORD | FIELDS nom_champ <...n> |
|
TO nom_table |
Emplacement vers lequel envoyer les résultats de la commande :
|
OPEN optionnel |
Ouvre la table créée par la commande après l'exécution de la commande. Valide uniquement lorsque la commande crée une table de sortie. |
APPEND optionnel |
Ajoute la sortie de commande à la fin d'un fichier existant au lieu de remplacer ce fichier. Remarque Vous devez vous assurer que la structure de la sortie de la commande et du fichier existant est identique :
Analytics ajoute la sortie à un fichier existant sans tenir compte de sa structure, ce qui peut désordonner les données si la structure de la sortie et du fichier existant ne correspond pas. |
MERSENNE_TWISTER optionnel |
Remarque Méthodes de sélection aléatoire et par cellule uniquement. Le générateur de nombres aléatoires d'Analytics utilise l'algorithme Mersenne-Twister. Si vous ignorez MERSENNE_TWISTER, l'algorithme d'Analytics par défaut est utilisé. Remarque Vous devez uniquement utiliser l'algorithme Analytics par défaut si vous avez besoin d'une rétrocompatibilité avec les scripts Analytics ou les résultats d'échantillonnage créés avant Analytics version 12. |
LOCAL optionnel |
Enregistre le fichier de sortie au même emplacement que le projet Analytics. Remarque Applicable uniquement lorsque vous exécutez la commande sur une table de serveur avec un fichier de sortie qui est une table Analytics. |
Exemples
Extraire un échantillon par unité monétaire
Vous allez utiliser un échantillonnage par unité monétaire pour estimer le montant total d'anomalie monétaire dans un compte contenant des factures.
Après avoir calculé une taille d'échantillon statistiquement valide, vous voilà prêt à extraire l'échantillon. Vous allez utiliser la méthode de sélection par intervalle fixe.
L'exemple ci-dessous :
- Échantillonne la table Analytics ouverte à partir d'un champ Montant des transactions
- Utilise la méthode de sélection à intervalle fixe avec une valeur d'intervalle de 6 283,33 €
- Indique que le premier enregistrement sélectionné contient la 100 000e unité monétaire (le nombre de centimes dans 1 000 €)
- Utilise une limite de couche supérieure de 5 000 €
- Inclut l'intégralité de l'enregistrement dans la table de sortie
SAMPLE ON Amount INTERVAL 6283.33 FIXED 1000.00 CUTOFF 5000.00 RECORD TO "C_échantillon_unité_monétaire" OPEN
Remarques
Remarque
Pour plus d'informations sur le fonctionnement de cette commande, consultez le Aide d'Analytics.