Commande CVSPREPARE

Stratifie une population et calcule une taille d'échantillon statistiquement valide pour chaque couche dans le cas de l'échantillonnage de variables classiques.

Syntaxe

CVSPREPARE <ON> champ_valeur_comptable NUMSTRATA nombre MINIMUM taille_échantillon_couches_minimale PRECISION valeur CONFIDENCE niveau_confiance <CUTOFF valeur> NCELLS nombre PLIMIT {BOTH|UPPER|LOWER} <ERRORLIMIT nombre <MINSAMPSIZE taille_échantillon_minimale> TO SCREEN|nom_fichier}

Paramètres

Remarque

N'incluez pas les séparateurs des milliers ou les symboles de pourcentage lorsque vous saisissez des valeurs.

Nom Description
ON valeur_champ_comptable Champ valeur comptable numérique à utiliser pour préparer l'échantillonnage de variables classiques.
NUMSTRATA nombre

Nombre de couches à utiliser pour stratifier numériquement le champ_valeur_comptable.

Le nombre minimal de couches est 1 et le nombre maximal est 256.

Si vous indiquez NUMSTRATA 1 mais pas de CUTOFF, la population reste non stratifiée avant l'extraction d'un échantillon.

Remarque

Le nombre de couches ne peut pas dépasser 50 % du nombre de cellules spécifiées pour NCELLS.

MINIMUM taille_échantillon_couches_minimale

Nombre minimum d'enregistrements à échantillonner dans chaque couche.

Laissez la valeur de zéro (0) par défaut si vous n'avez aucune raison particulière de préciser un nombre minimum.

PRECISION valeur

Le montant monétaire qui est la différence entre l'anomalie acceptable et l'anomalie probable dans le compte.

  • Anomalie acceptable le montant total maximal de l'anomalie que peut présenter le champ de l'échantillon sans que cela soit considéré comme étant une anomalie significative
  • Anomalie probable le montant total de l'anomalie que vous prévoyez de voir contenir le champ de l'échantillon

La précision définit la plage d'acceptabilité pour qu'un compte soit considéré comme évalué justement.

Réduire la précision diminue la plage d'acceptabilité (la marge d'erreur) nécessitant une plus grande taille d'échantillon.

CONFIDENCE niveau_confiance

Le niveau de confiance que vous souhaitez attribuer au fait que l'échantillon créé est représentatif de la population totale.

Par exemple, saisir 95 signifie que vous souhaitez être sûr 95 % du temps que l'échantillon sera bien représentatif. La confiance est le complément du « risque d'échantillonnage ». Un niveau de confiance de 95 % équivaut à un risque d'échantillonnage de 5 %.

  • Si PLIMIT est BOTH, le niveau de confiance minimum est de 10 % et le niveau de confiance maximum est de 99,5 %.
  • Si PLIMIT est UPPER ou LOWER, le niveau de confiance minimum est de 55 % et le niveau de confiance maximum est de 99,5 %.
CUTOFF valeur

optionnel

Valeur limite de couche de certitude.

Les montants dans champ_valeur_comptable qui sont supérieurs ou égaux à la valeur limite sont sélectionnés et inclus automatiquement dans l'échantillon.

Si vous ignorez CUTOFF, une valeur limite par défaut égale au montant maximum dans le champ_valeur_comptable est utilisée.

NCELLS nombre

Nombre de cellules à utiliser pour pré-stratifier le champ_valeur_comptable.

Les cellules sont des divisions numériques plus étroites que les couches. La pré-stratification fait partie d'un processus interne optimisant la position des limites des couches. Les cellules ne sont pas conservées dans la sortie stratifiée définitive.

Le nombre minimal de cellules est 2 et le nombre maximal est 999.

Remarque

Le nombre de cellules doit être au moins le double (2 x) du nombre de couches indiqué pour NUMSTRATA.

PLIMIT BOTH | UPPER | LOWER

Type de limite de précision à utiliser.

  • BOTH : spécifiez cette option si :
    • le compte dans son ensemble peut être surestimé ou sous-estimé
    • vous êtes intéressé pour estimer si l'anomalie dans un des deux sens dépasse la PRECISION indiquée
  • UPPER : spécifiez cette option si :
    • le compte dans son ensemble est susceptible d'être sous-estimé
    • vous êtes intéressé pour estimer si le montant total de la sous-évaluation dépasse la PRECISION indiquée
  • LOWER : spécifiez cette option si :
    • le compte dans son ensemble est susceptible d'être surestimé
    • vous êtes intéressé pour estimer si le montant total de la surévaluation dépasse la PRECISION indiquée

    Attention

    Indiquez BOTH si vous ne savez pas quelle option indiquer.

ERRORLIMIT nombre

Nombre minimal d'erreurs que vous prévoyez dans l'échantillon.

Remarque

Si le nombre réel d'erreurs que vous trouvez lorsque vous analysez l'échantillon est inférieur au nombre ERRORLIMIT, la seule méthode d'évaluation possible est la moyenne unitaire.

MINSAMPSIZE taille_échantillon_minimum

optionnel

Nombre minimum d'enregistrements à échantillonner dans l'intégralité de la population.

Laissez la valeur de zéro (0) par défaut si vous n'avez aucune raison particulière de préciser un nombre minimum.

TO SCREEN | nom_fichier

Emplacement vers lequel envoyer les résultats de la commande :

  • SCREEN affiche les résultats dans la zone d'affichage d'Analytics.
  • nom_fichier enregistre les résultats dans un fichier

    Indiquez nom_fichier sous forme de chaîne entre guillemets avec l'extension de fichier appropriée. Par exemple : TO "Sortie.TXT"

    Par défaut, le fichier est enregistré dans le dossier contenant le projet Analytics.

    Utilisez un chemin de fichier absolu ou relatif pour enregistrer le fichier dans un autre dossier existant :

    • TO "C:\Sortie.TXT"
    • TO "Résultats\Sortie.TXT"

Variables de sortie Analytics

Nom Contient
CONFIDENCE Niveau de confiance indiqué par l'utilisateur.
ERRLIMIT Nombre minimum d'erreurs spécifié par l'utilisateur.
NSTRATA Nombre de couches spécifié par l'utilisateur.
PLIMIT Type de limite de précision spécifiée par l'utilisateur.
S_TOP Valeur de la limite de la couche de certitude spécifiée par l'utilisateur ; si aucune valeur n'a été indiquée, il s'agit de la limite supérieure de la couche supérieure calculée par la commande.
SAMPLEFIELD Champ de valeur comptable spécifié par l'utilisateur.
SBOTTOM Limite inférieure de la couche inférieure calculée par la commande.
SBOUNDARY Toutes les limites supérieures des couches calculées par la commande, et S_TOP. Ne stocke pas SBOTTOM.
SPOPULATION Le compte du nombre d'enregistrements dans chaque couche et la valeur monétaire totale de chaque couche. Exclut les éléments supérieurs à la limite de couche de certitude
SSAMPLE Taille d'échantillon de chaque couche calculée par la commande.

Exemples

Préparer un échantillon de variables classiques

Vous avez décidé d'utiliser un échantillonnage de variables classiques pour estimer le montant total d'anomalie monétaire dans un compte contenant des factures.

Avant d'extraire l'échantillon, vous devez d'abord stratifier la population et calculer une taille d'échantillon statistiquement valide pour chaque couche.

Vous souhaitez être sûr 95 % du temps que l'échantillon extrait par Analytics sera bien représentatif de l'ensemble de la population.

À l'aide du niveau de confiance que vous avez spécifié, l'exemple ci-dessous stratifie une table à partir du champ Montant_Facture et calcule la taille d'échantillon correspondant à chaque couche et à la couche de certitude :

CVSPREPARE ON Montant_Facture NUMSTRATA 5 MINIMUM 0 PRECISION 928003,97 CONFIDENCE 95,00 CUTOFF 35000 NCELLS 50 PLIMIT BOTH ERRORLIMIT 6 MINSAMPSIZE 0 TO SCREEN

Remarques

Remarque

Pour plus d'informations sur le fonctionnement de cette commande, consultez le Aide d'Analytics.

Limitation de longueur numérique

Plusieurs calculs internes ont eu lieu pendant l'étape de préparation de l'échantillonnage de variables classiques. Ces calculs prennent en charge les nombres d'une longueur maximale de 17 chiffres. Si le résultat d'un calcul dépasse 17 chiffres, ce résultat ne figure pas dans la sortie et vous ne pouvez pas poursuivre le processus d'échantillonnage.

Notez que les nombres des données source d'une longueur inférieure à 17 chiffres peuvent générer des résultats de calculs internes dépassant les 17 chiffres.

Guide de création de scripts ACL 14.1