Commande CVSPREPARE
Stratifie une population et calcule une taille d'échantillon statistiquement valide pour chaque couche dans le cas de l'échantillonnage de variables classiques.
Syntaxe
CVSPREPARE <ON> champ_valeur_comptable NUMSTRATA nombre MINIMUM taille_échantillon_couches_minimale PRECISION valeur CONFIDENCE niveau_confiance <CUTOFF valeur> NCELLS nombre PLIMIT {BOTH|UPPER|LOWER} <ERRORLIMIT nombre <MINSAMPSIZE taille_échantillon_minimale> TO SCREEN|nom_fichier}
Paramètres
Remarque
N'incluez pas les séparateurs des milliers ou les symboles de pourcentage lorsque vous saisissez des valeurs.
Nom | Description |
---|---|
ON valeur_champ_comptable | Champ valeur comptable numérique à utiliser pour préparer l'échantillonnage de variables classiques. |
NUMSTRATA nombre |
Nombre de couches à utiliser pour stratifier numériquement le champ_valeur_comptable. Le nombre minimal de couches est 1 et le nombre maximal est 256. Si vous indiquez NUMSTRATA 1 mais pas de CUTOFF, la population reste non stratifiée avant l'extraction d'un échantillon. Remarque Le nombre de couches ne peut pas dépasser 50 % du nombre de cellules spécifiées pour NCELLS. |
MINIMUM taille_échantillon_couches_minimale |
Nombre minimum d'enregistrements à échantillonner dans chaque couche. Laissez la valeur de zéro (0) par défaut si vous n'avez aucune raison particulière de préciser un nombre minimum. |
PRECISION valeur |
Le montant monétaire qui est la différence entre l'anomalie acceptable et l'anomalie probable dans le compte.
La précision définit la plage d'acceptabilité pour qu'un compte soit considéré comme évalué justement. Réduire la précision diminue la plage d'acceptabilité (la marge d'erreur) nécessitant une plus grande taille d'échantillon. |
CONFIDENCE niveau_confiance |
Le niveau de confiance que vous souhaitez attribuer au fait que l'échantillon créé est représentatif de la population totale. Par exemple, saisir 95 signifie que vous souhaitez être sûr 95 % du temps que l'échantillon sera bien représentatif. La confiance est le complément du « risque d'échantillonnage ». Un niveau de confiance de 95 % équivaut à un risque d'échantillonnage de 5 %.
|
CUTOFF valeur optionnel |
Valeur limite de couche de certitude. Les montants dans champ_valeur_comptable qui sont supérieurs ou égaux à la valeur limite sont sélectionnés et inclus automatiquement dans l'échantillon. Si vous ignorez CUTOFF, une valeur limite par défaut égale au montant maximum dans le champ_valeur_comptable est utilisée. |
NCELLS nombre |
Nombre de cellules à utiliser pour pré-stratifier le champ_valeur_comptable. Les cellules sont des divisions numériques plus étroites que les couches. La pré-stratification fait partie d'un processus interne optimisant la position des limites des couches. Les cellules ne sont pas conservées dans la sortie stratifiée définitive. Le nombre minimal de cellules est 2 et le nombre maximal est 999. Remarque Le nombre de cellules doit être au moins le double (2 x) du nombre de couches indiqué pour NUMSTRATA. |
PLIMIT BOTH | UPPER | LOWER |
Type de limite de précision à utiliser.
|
ERRORLIMIT nombre |
Nombre minimal d'erreurs que vous prévoyez dans l'échantillon. Remarque Si le nombre réel d'erreurs que vous trouvez lorsque vous analysez l'échantillon est inférieur au nombre ERRORLIMIT, la seule méthode d'évaluation possible est la moyenne unitaire. |
MINSAMPSIZE taille_échantillon_minimum optionnel |
Nombre minimum d'enregistrements à échantillonner dans l'intégralité de la population. Laissez la valeur de zéro (0) par défaut si vous n'avez aucune raison particulière de préciser un nombre minimum. |
TO SCREEN | nom_fichier |
Emplacement vers lequel envoyer les résultats de la commande :
|
Variables de sortie Analytics
Nom | Contient |
---|---|
CONFIDENCE | Niveau de confiance indiqué par l'utilisateur. |
ERRLIMIT | Nombre minimum d'erreurs spécifié par l'utilisateur. |
NSTRATA | Nombre de couches spécifié par l'utilisateur. |
PLIMIT | Type de limite de précision spécifiée par l'utilisateur. |
S_TOP | Valeur de la limite de la couche de certitude spécifiée par l'utilisateur ; si aucune valeur n'a été indiquée, il s'agit de la limite supérieure de la couche supérieure calculée par la commande. |
SAMPLEFIELD | Champ de valeur comptable spécifié par l'utilisateur. |
SBOTTOM | Limite inférieure de la couche inférieure calculée par la commande. |
SBOUNDARY | Toutes les limites supérieures des couches calculées par la commande, et S_TOP. Ne stocke pas SBOTTOM. |
SPOPULATION | Le compte du nombre d'enregistrements dans chaque couche et la valeur monétaire totale de chaque couche. Exclut les éléments supérieurs à la limite de couche de certitude |
SSAMPLE | Taille d'échantillon de chaque couche calculée par la commande. |
Exemples
Préparer un échantillon de variables classiques
Vous avez décidé d'utiliser un échantillonnage de variables classiques pour estimer le montant total d'anomalie monétaire dans un compte contenant des factures.
Avant d'extraire l'échantillon, vous devez d'abord stratifier la population et calculer une taille d'échantillon statistiquement valide pour chaque couche.
Vous souhaitez être sûr 95 % du temps que l'échantillon extrait par Analytics sera bien représentatif de l'ensemble de la population.
À l'aide du niveau de confiance que vous avez spécifié, l'exemple ci-dessous stratifie une table à partir du champ Montant_Facture et calcule la taille d'échantillon correspondant à chaque couche et à la couche de certitude :
CVSPREPARE ON Montant_Facture NUMSTRATA 5 MINIMUM 0 PRECISION 928003,97 CONFIDENCE 95,00 CUTOFF 35000 NCELLS 50 PLIMIT BOTH ERRORLIMIT 6 MINSAMPSIZE 0 TO SCREEN
Remarques
Remarque
Pour plus d'informations sur le fonctionnement de cette commande, consultez le Aide d'Analytics.
Limitation de longueur numérique
Plusieurs calculs internes ont eu lieu pendant l'étape de préparation de l'échantillonnage de variables classiques. Ces calculs prennent en charge les nombres d'une longueur maximale de 17 chiffres. Si le résultat d'un calcul dépasse 17 chiffres, ce résultat ne figure pas dans la sortie et vous ne pouvez pas poursuivre le processus d'échantillonnage.
Notez que les nombres des données source d'une longueur inférieure à 17 chiffres peuvent générer des résultats de calculs internes dépassant les 17 chiffres.