Comando SAMPLE
Extrae una muestra de registros utilizando el método de muestreo por registros o de muestreo por unidad monetaria.
Sintaxis
Nota
La sintaxis no incluye el filtrado (enunciados IF) o parámetros de alcance ya que aplicar estas opciones compromete la validez de la muestra.
Método de selección de intervalo fijo
SAMPLE <ON> RECORD INTERVAL valor_intervalo <FIXED valor_inicial> {RECORD|FIELDS nombre_de_campo <...n>} TO nombre_de_tabla <OPEN> <APPEND> <LOCAL>
Método de selección de celdas
SAMPLE <ON> RECORD CELL INTERVAL valor_intervalo <RANDOM valor_semilla> {RECORD|FIELDS nombre_de_campo <...n>} TO nombre_de_tabla <OPEN> <APPEND> <MERSENNE_TWISTER> <LOCAL>
Método de selección aleatorio
SAMPLE <ON> RECORD NUMBER tamaño_muestra <RANDOM valor_semilla <ORDER> {RECORD|FIELDS nombre_de_campo <...n>} TO nombre_de_tabla <OPEN> <APPEND> <MERSENNE_TWISTER> <LOCAL>
Parámetros
Nota
No incluya los separadores de mil al especificar los valores.
Nombre | Descripción |
---|---|
ON RECORD | Utilice muestreo de registros. |
INTERVAL valor_intervalo FIXED valor_inicial | CELL INTERVAL valor_intervalo | NUMBER tamaño_muestra |
INTERVAL valor_intervalo FIXED valor_inicialUtilice el método de selección de intervalo fijo. Se selecciona un registro inicial y todas las selecciones posteriores se encuentran a una distancia o un intervalo fijo; por ejemplo, cada 20º registro después de la selección inicial.
CELL INTERVAL valor_intervaloUtilice el método de selección de celdas. El conjunto de datos se divide en varias celdas o grupos de igual tamaño y se selecciona un registro de forma aleatoria de cada celda. El valor_intervalo indica el tamaño de cada celda. Especifica el valor de intervalo que se generó al calcular el tamaño de la muestra. NUMBER tamaño_de_la_muestraUtilice el método de selección aleatorio. Todos los registros se seleccionan de forma aleatoria del conjunto de datos completo. Especifica el tamaño de la muestra que se generó al calcular el tamaño de la muestra. |
RANDOM valor_semilla opcional |
Nota Métodos de selección aleatorio y de celda únicamente. El valor semilla que se debe usar para inicializar el generador de números aleatorios en Analytics. Si especifica un valor de cero ('0') u omite RANDOM, Analytics selecciona de manera aleatoria el valor semilla. |
ORDER opcional |
Nota Método de selección aleatorio únicamente. Solo puede usar ORDER al especificar FIELDS. Agrega el campo ORDER a los resultados de salida. Este campo muestra el orden en el cual cada registro se selecciona aleatoriamente. |
RECORD | FIELDS nombre_de_campo <...n> |
|
TO nombre_tabla |
El lugar al que se deben enviar los resultados del comando:
|
OPEN opcional |
Abre la tabla creada por el comando después de la ejecución del comando. Solo es válido si el comando crea una tabla de salida. |
APPEND opcional |
Anexa la salida del comando al final de un archivo existente en lugar de sobrescribir el archivo. Nota Debe asegurarse de que la estructura de la salida del comando y del archivo existente sean idénticas:
Analytics anexa la salida a un archivo existente sin importar cuál sea su estructura. Si la estructura de la salida y la del archivo existente no coinciden, es posible que los datos que se obtengan estén incompletos, mezclados o sean imprecisos. |
MERSENNE_TWISTER opcional |
Nota Métodos de selección aleatorio y de celda únicamente. El generador de números aleatorios de Analytics utiliza el algoritmo Mersenne-Twister. Si se omite MERSENNE_TWISTER, se utiliza el algoritmo predeterminado de Analytics. Nota Solo seleccione el algoritmo predeterminado de Analytics si requiere tener compatibilidad con versiones anteriores de los scripts de Analytics o con los resultados de muestras creados antes de la versión 12 de Analytics. |
LOCAL opcional |
Guarda el archivo de salida en la misma ubicación que el proyecto de Analytics. Nota Aplicable únicamente al ejecutar el comando en una tabla de servidor con un archivo de salida que es una tabla de Analytics. |
Ejemplos
Extraer una muestra de registros
Va a usar el muestreo de registros para estimar el índice de desviación de un control preestablecido en una cuenta que contiene facturas.
Después de calcular un tamaño de muestra estadísticamente válido, está preparado para extraer la muestra. Va a utilizar el método de selección aleatorio.
El siguiente ejemplo:
- Toma muestras de la tabla de Analytics abierta
- Utiliza el método de selección aleatoria con un valor de semilla de 123456
- Especifica un tamaño de muestra de 95 registros
- Incluye únicamente los campos especificados en la tabla de salida
- Especifica que el generador de números aleatorios de Analytics utiliza el algoritmo Mersenne-Twister.
SAMPLE ON RECORD RANDOM 123456 NUMBER 95 FIELDS NúmRef NúmCliente Importe Fecha Tipo TO "Ar_muestra_registros" OPEN MERSENNE_TWISTER
Observaciones
Nota
Si desea obtener más información sobre la forma en la que funciona este comando, consulte Guía de ayuda.
Sintaxis
Nota
La sintaxis no incluye el filtrado (enunciados IF) o parámetros de alcance ya que aplicar estas opciones compromete la validez de la muestra.
Método de selección de intervalo fijo
SAMPLE <ON> campo_numérico_mus INTERVAL valor_intervalo <FIXED valor_inicial> <CUTOFF valor_corte_estrato_superior> <SUBSAMPLE> <NOREPLACEMENT> {RECORD|FIELDS nombre_de_campo <...n>} TO nombre_de_tabla <OPEN> <APPEND> <LOCAL>
Método de selección de celdas
SAMPLE <ON> campo_numérico_mus CELL INTERVAL valor_intervalo <CUTOFF valor_corte_estrato_superior> <RANDOM valor_semilla> <SUBSAMPLE> <NOREPLACEMENT> {RECORD|FIELDS nombre_de_campo <...n>} TO nombre_de_tabla <OPEN> <APPEND> <MERSENNE_TWISTER> <LOCAL>
Método de selección aleatorio
SAMPLE <ON> campo_numérico_mus NUMBER tamaño_muestra POPULATION valor_absoluto <RANDOM valor_semilla> <SUBSAMPLE> <NOREPLACEMENT> <ORDER> {RECORD|FIELDS nombre_de_campo <...n>} TO nombre_de_tabla <OPEN> <APPEND> <MERSENNE_TWISTER> <LOCAL>
Parámetros
Nota
No incluya los separadores de mil al especificar los valores.
Nombre | Descripción |
---|---|
ON campo_numérico_mus |
Utilice el muestreo por unidad monetaria (MUS). campo_numérico_mus es la expresión o el campo numérico que se debe utilizar como la base para el muestreo. |
INTERVAL valor_intervalo FIXED valor_inicial | CELL INTERVAL valor_intervalo | NUMBER tamaño_muestra POPULATION valor_absoluto |
INTERVAL valor_intervalo FIXED valor_inicialUtilice el método de selección de intervalo fijo. Se selecciona una unidad monetaria inicial y todas las selecciones posteriores se encuentran a una distancia o un intervalo fijo; por ejemplo, cada 5000º unidades monetarias después de la selección inicial.
CELL INTERVAL valor_intervaloUtilice el método de selección de celdas. El conjunto de datos se divide en varias celdas o grupos de igual tamaño y se selecciona una unidad monetaria de forma aleatoria de cada celda. El valor_intervalo indica el tamaño de cada celda. Especifica el valor de intervalo que se generó al calcular el tamaño de la muestra. NUMBER tamaño_muestra POPULATION valor_absolutoUtilice el método de selección aleatorio. Todas las unidades monetarias se seleccionan de forma aleatoria del conjunto de datos completo.
|
CUTOFF valor_corte_estrato_superior opcional |
Nota Métodos de selección de intervalo fijo y de celda únicamente. Un valor de corte de estrato superior. Las cantidades del campo_numérico_mus que sean mayores o iguales al valor de corte se seleccionarán automáticamente y se incluirán en la muestra. Si omite CUTOFF, se usará un valor de corte predeterminado igual al valor_intervalo. |
RANDOM valor_semilla opcional |
Nota Métodos de selección aleatorio y de celda únicamente. El valor semilla que se debe usar para inicializar el generador de números aleatorios en Analytics. Si especifica un valor de cero ('0') u omite RANDOM, Analytics selecciona de manera aleatoria el valor semilla. |
SUBSAMPLE opcional |
Nota Solo puede usar SUBSAMPLE al especificar FIELDS. Agrega el campo SUBSAMPLE a los resultados de salida. Si cada importe de un campo de muestra representa el total de varias transacciones independientes y usted desea realizar procedimientos de auditoría únicamente en una transacción de cada muestreado, puede usar los valores del campo SUBSAMPLE para seleccionar aleatoriamente transacciones individuales. Si desea obtener más información, consulte Realización del muestreo por unidad monetaria. |
NOREPLACEMENT opcional |
No se selecciona el mismo registro más de una vez. Como resultado, la muestra puede contener menos registros que los que se calcularon con el comando SIZE. Si se omite NOREPLACEMENT, o si usted especifica REPLACEMENT, los registros se pueden seleccionar más de una vez. |
ORDER opcional |
Nota Método de selección aleatorio únicamente. Solo puede usar ORDER al especificar FIELDS. Agrega el campo ORDER a los resultados de salida. Este campo muestra el orden en el cual cada registro se selecciona aleatoriamente. |
RECORD | FIELDS nombre_de_campo <...n> |
|
TO nombre_tabla |
El lugar al que se deben enviar los resultados del comando:
|
OPEN opcional |
Abre la tabla creada por el comando después de la ejecución del comando. Solo es válido si el comando crea una tabla de salida. |
APPEND opcional |
Anexa la salida del comando al final de un archivo existente en lugar de sobrescribir el archivo. Nota Debe asegurarse de que la estructura de la salida del comando y del archivo existente sean idénticas:
Analytics anexa la salida a un archivo existente sin importar cuál sea su estructura. Si la estructura de la salida y la del archivo existente no coinciden, es posible que los datos que se obtengan estén incompletos, mezclados o sean imprecisos. |
MERSENNE_TWISTER opcional |
Nota Métodos de selección aleatorio y de celda únicamente. El generador de números aleatorios de Analytics utiliza el algoritmo Mersenne-Twister. Si se omite MERSENNE_TWISTER, se utiliza el algoritmo predeterminado de Analytics. Nota Solo seleccione el algoritmo predeterminado de Analytics si requiere tener compatibilidad con versiones anteriores de los scripts de Analytics o con los resultados de muestras creados antes de la versión 12 de Analytics. |
LOCAL opcional |
Guarda el archivo de salida en la misma ubicación que el proyecto de Analytics. Nota Aplicable únicamente al ejecutar el comando en una tabla de servidor con un archivo de salida que es una tabla de Analytics. |
Ejemplos
Extraer una muestra de unidad monetaria
Va a utilizar el muestreo de unidad monetaria para estimar el importe total de información monetaria errónea en una cuenta que contiene facturas.
Después de calcular un tamaño de muestra estadísticamente válido, está preparado para extraer la muestra. Va a utilizar el método de selección de intervalo fijo.
El siguiente ejemplo:
- Toma muestras de la tabla de Analytics abierta, sobre la base de un campo de importe de la transacción
- Utiliza el método de selección del intervalo fijo con un valor de intervalo de $6.283,33
- Especifica que el primer registro seleccionado contiene la unidad monetaria 100.000 (el número de centavos es $1.000)
- Utiliza un corte de estrato de $5.000
- Incluye el registro completo en la tabla de salida.
SAMPLE ON Importe INTERVAL 6283,33 FIXED 1000,00 CUTOFF 5000,00 RECORD TO "Ar_muestra_unidad_monetaria" OPEN
Observaciones
Nota
Si desea obtener más información sobre la forma en la que funciona este comando, consulte Guía de ayuda.