Comando SAMPLE

Extrae una muestra de registros utilizando el método de muestreo por registros o de muestreo por unidad monetaria.

Sintaxis

Nota

La sintaxis no incluye el filtrado (enunciados IF) o parámetros de alcance ya que aplicar estas opciones compromete la validez de la muestra.

Método de selección de intervalo fijo

SAMPLE <ON> RECORD INTERVAL valor_intervalo <FIXED valor_inicial> {RECORD|FIELDS nombre_de_campo <...n>} TO nombre_de_tabla <OPEN> <APPEND> <LOCAL>

Método de selección de celdas

SAMPLE <ON> RECORD CELL INTERVAL valor_intervalo <RANDOM valor_semilla> {RECORD|FIELDS nombre_de_campo <...n>} TO nombre_de_tabla <OPEN> <APPEND> <MERSENNE_TWISTER> <LOCAL>

Método de selección aleatorio

SAMPLE <ON> RECORD NUMBER tamaño_muestra <RANDOM valor_semilla <ORDER> {RECORD|FIELDS nombre_de_campo <...n>} TO nombre_de_tabla <OPEN> <APPEND> <MERSENNE_TWISTER> <LOCAL>

Parámetros

Nota

No incluya los separadores de mil al especificar los valores.

Nombre Descripción
ON RECORD Utilice muestreo de registros.
INTERVAL valor_intervalo FIXED valor_inicial | CELL INTERVAL valor_intervalo | NUMBER tamaño_muestra

INTERVAL valor_intervalo FIXED valor_inicial

Utilice el método de selección de intervalo fijo.

Se selecciona un registro inicial y todas las selecciones posteriores se encuentran a una distancia o un intervalo fijo; por ejemplo, cada 20º registro después de la selección inicial.

  • INTERVAL valor_intervalo especifique el valor del intervalo que se generó al calcular el tamaño de la muestra.
  • FIXED valor_inicial especifique el número de registro inicial que se seleccionó

    Si especifica un valor_inicial de cero ('0') u omite FIXED, Analytics selecciona el registro inicial de forma aleatoria.

CELL INTERVAL valor_intervalo

Utilice el método de selección de celdas.

El conjunto de datos se divide en varias celdas o grupos de igual tamaño y se selecciona un registro de forma aleatoria de cada celda.

El valor_intervalo indica el tamaño de cada celda. Especifica el valor de intervalo que se generó al calcular el tamaño de la muestra.

NUMBER tamaño_de_la_muestra

Utilice el método de selección aleatorio.

Todos los registros se seleccionan de forma aleatoria del conjunto de datos completo.

Especifica el tamaño de la muestra que se generó al calcular el tamaño de la muestra.

RANDOM valor_semilla

opcional

Nota

Métodos de selección aleatorio y de celda únicamente.

El valor semilla que se debe usar para inicializar el generador de números aleatorios en Analytics.

Si especifica un valor de cero ('0') u omite RANDOM, Analytics selecciona de manera aleatoria el valor semilla.

ORDER

opcional

Nota

Método de selección aleatorio únicamente.

Solo puede usar ORDER al especificar FIELDS.

Agrega el campo ORDER a los resultados de salida.

Este campo muestra el orden en el cual cada registro se selecciona aleatoriamente.

RECORD | FIELDS nombre_de_campo <...n>
  • RECORD el registro completo se incluye en la tabla de salida
  • FIELDS se incluyen campos individuales, en lugar del registro completo, en la tabla de salida

    Especifique los campos o expresiones que se deben incluir. Si especifica varios campos, deben estar separados por espacios.

TO nombre_tabla

El lugar al que se deben enviar los resultados del comando:

  • nombre_tabla guarda los resultados en una tabla de Analytics

    Especifique el nombre_tabla como una cadena entre comillas con la extensión de archivo .FIL. Por ejemplo: TO "Salida.FIL"

    Por valor predeterminado, el archivo de datos de la tabla (.FIL) se guarda en la carpeta que contiene el proyecto de Analytics.

    Utilice una ruta de archivo absoluta o relativa para guardar el archivo de datos en una carpeta existente o una diferente:

    • TO "C:\Salida.FIL"
    • TO "Resultados\Salida.FIL"

    Nota

    Los nombres de las tablas tienen un límite de 64 caracteres alfanuméricos, sin incluir la extensión .FIL. El nombre puede incluir un guión bajo ( _ ), pero no puede incluir ningún otro carácter especial ni espacios. El nombre no puede comenzar con un número.

OPEN

opcional

Abre la tabla creada por el comando después de la ejecución del comando. Solo es válido si el comando crea una tabla de salida.

APPEND

opcional

Anexa la salida del comando al final de un archivo existente en lugar de sobrescribir el archivo.

Nota

Debe asegurarse de que la estructura de la salida del comando y del archivo existente sean idénticas:

  • los mismos campos
  • el mismo orden de campos
  • los campos coincidentes son de la misma longitud
  • los campos coincidentes tienen el mismo tipo de datos

Analytics anexa la salida a un archivo existente sin importar cuál sea su estructura. Si la estructura de la salida y la del archivo existente no coinciden, es posible que los datos que se obtengan estén incompletos, mezclados o sean imprecisos.

MERSENNE_TWISTER

opcional

Nota

Métodos de selección aleatorio y de celda únicamente.

El generador de números aleatorios de Analytics utiliza el algoritmo Mersenne-Twister.

Si se omite MERSENNE_TWISTER, se utiliza el algoritmo predeterminado de Analytics.

Nota

Solo seleccione el algoritmo predeterminado de Analytics si requiere tener compatibilidad con versiones anteriores de los scripts de Analytics o con los resultados de muestras creados antes de la versión 12 de Analytics.

LOCAL

opcional

Guarda el archivo de salida en la misma ubicación que el proyecto de Analytics.

Nota

Aplicable únicamente al ejecutar el comando en una tabla de servidor con un archivo de salida que es una tabla de Analytics.

Ejemplos

Extraer una muestra de registros

Va a usar el muestreo de registros para estimar el índice de desviación de un control preestablecido en una cuenta que contiene facturas.

Después de calcular un tamaño de muestra estadísticamente válido, está preparado para extraer la muestra. Va a utilizar el método de selección aleatorio.

El siguiente ejemplo:

  • Toma muestras de la tabla de Analytics abierta
  • Utiliza el método de selección aleatoria con un valor de semilla de 123456
  • Especifica un tamaño de muestra de 95 registros
  • Incluye únicamente los campos especificados en la tabla de salida
  • Especifica que el generador de números aleatorios de Analytics utiliza el algoritmo Mersenne-Twister.
SAMPLE ON RECORD RANDOM 123456 NUMBER 95 FIELDS NúmRef NúmCliente Importe Fecha Tipo TO "Ar_muestra_registros" OPEN MERSENNE_TWISTER

Observaciones

Nota

Si desea obtener más información sobre la forma en la que funciona este comando, consulte Guía de ayuda.

Sintaxis

Nota

La sintaxis no incluye el filtrado (enunciados IF) o parámetros de alcance ya que aplicar estas opciones compromete la validez de la muestra.

Método de selección de intervalo fijo

SAMPLE <ON> campo_numérico_mus INTERVAL valor_intervalo <FIXED valor_inicial> <CUTOFF valor_corte_estrato_superior> <SUBSAMPLE> <NOREPLACEMENT> {RECORD|FIELDS nombre_de_campo <...n>} TO nombre_de_tabla <OPEN> <APPEND> <LOCAL>

Método de selección de celdas

SAMPLE <ON> campo_numérico_mus CELL INTERVAL valor_intervalo <CUTOFF valor_corte_estrato_superior> <RANDOM valor_semilla> <SUBSAMPLE> <NOREPLACEMENT> {RECORD|FIELDS nombre_de_campo <...n>} TO nombre_de_tabla <OPEN> <APPEND> <MERSENNE_TWISTER> <LOCAL>

Método de selección aleatorio

SAMPLE <ON> campo_numérico_mus NUMBER tamaño_muestra POPULATION valor_absoluto <RANDOM valor_semilla> <SUBSAMPLE> <NOREPLACEMENT> <ORDER> {RECORD|FIELDS nombre_de_campo <...n>} TO nombre_de_tabla <OPEN> <APPEND> <MERSENNE_TWISTER> <LOCAL>

Parámetros

Nota

No incluya los separadores de mil al especificar los valores.

Nombre Descripción
ON campo_numérico_mus

Utilice el muestreo por unidad monetaria (MUS).

campo_numérico_mus es la expresión o el campo numérico que se debe utilizar como la base para el muestreo.

INTERVAL valor_intervalo FIXED valor_inicial | CELL INTERVAL valor_intervalo | NUMBER tamaño_muestra POPULATION valor_absoluto

INTERVAL valor_intervalo FIXED valor_inicial

Utilice el método de selección de intervalo fijo.

Se selecciona una unidad monetaria inicial y todas las selecciones posteriores se encuentran a una distancia o un intervalo fijo; por ejemplo, cada 5000º unidades monetarias después de la selección inicial.

  • INTERVAL valor_intervalo especifique el valor del intervalo que se generó al calcular el tamaño de la muestra.
  • FIXED valor_inicial especifique el número de unidad monetaria inicial que seleccionó

    Si especifica un valor_inicial de cero ('0') u omite FIXED, Analytics selecciona la unidad monetaria de forma aleatoria.

CELL INTERVAL valor_intervalo

Utilice el método de selección de celdas.

El conjunto de datos se divide en varias celdas o grupos de igual tamaño y se selecciona una unidad monetaria de forma aleatoria de cada celda.

El valor_intervalo indica el tamaño de cada celda. Especifica el valor de intervalo que se generó al calcular el tamaño de la muestra.

NUMBER tamaño_muestra POPULATION valor_absoluto

Utilice el método de selección aleatorio.

Todas las unidades monetarias se seleccionan de forma aleatoria del conjunto de datos completo.

  • NUMBER tamaño_muestra especifique el tamaño de la muestra que se generó al calcular el tamaño de la muestra.
  • POPULATION valor_absoluto especifique el valor absoluto total de campo_numérico_mus, que es la población de la cual se seleccionará la muestra.
CUTOFF valor_corte_estrato_superior

opcional

Nota

Métodos de selección de intervalo fijo y de celda únicamente.

Un valor de corte de estrato superior.

Las cantidades del campo_numérico_mus que sean mayores o iguales al valor de corte se seleccionarán automáticamente y se incluirán en la muestra.

Si omite CUTOFF, se usará un valor de corte predeterminado igual al valor_intervalo.

RANDOM valor_semilla

opcional

Nota

Métodos de selección aleatorio y de celda únicamente.

El valor semilla que se debe usar para inicializar el generador de números aleatorios en Analytics.

Si especifica un valor de cero ('0') u omite RANDOM, Analytics selecciona de manera aleatoria el valor semilla.

SUBSAMPLE

opcional

Nota

Solo puede usar SUBSAMPLE al especificar FIELDS.

Agrega el campo SUBSAMPLE a los resultados de salida.

Si cada importe de un campo de muestra representa el total de varias transacciones independientes y usted desea realizar procedimientos de auditoría únicamente en una transacción de cada muestreado, puede usar los valores del campo SUBSAMPLE para seleccionar aleatoriamente transacciones individuales.

Si desea obtener más información, consulte Realización del muestreo por unidad monetaria.

NOREPLACEMENT

opcional

No se selecciona el mismo registro más de una vez. Como resultado, la muestra puede contener menos registros que los que se calcularon con el comando SIZE.

Si se omite NOREPLACEMENT, o si usted especifica REPLACEMENT, los registros se pueden seleccionar más de una vez.

ORDER

opcional

Nota

Método de selección aleatorio únicamente.

Solo puede usar ORDER al especificar FIELDS.

Agrega el campo ORDER a los resultados de salida.

Este campo muestra el orden en el cual cada registro se selecciona aleatoriamente.

RECORD | FIELDS nombre_de_campo <...n>
  • RECORD el registro completo se incluye en la tabla de salida
  • FIELDS se incluyen campos individuales, en lugar del registro completo, en la tabla de salida

    Especifique los campos o expresiones que se deben incluir. Si especifica varios campos, deben estar separados por espacios.

TO nombre_tabla

El lugar al que se deben enviar los resultados del comando:

  • nombre_tabla guarda los resultados en una tabla de Analytics

    Especifique el nombre_tabla como una cadena entre comillas con la extensión de archivo .FIL. Por ejemplo: TO "Salida.FIL"

    Por valor predeterminado, el archivo de datos de la tabla (.FIL) se guarda en la carpeta que contiene el proyecto de Analytics.

    Utilice una ruta de archivo absoluta o relativa para guardar el archivo de datos en una carpeta existente o una diferente:

    • TO "C:\Salida.FIL"
    • TO "Resultados\Salida.FIL"

    Nota

    Los nombres de las tablas tienen un límite de 64 caracteres alfanuméricos, sin incluir la extensión .FIL. El nombre puede incluir un guión bajo ( _ ), pero no puede incluir ningún otro carácter especial ni espacios. El nombre no puede comenzar con un número.

OPEN

opcional

Abre la tabla creada por el comando después de la ejecución del comando. Solo es válido si el comando crea una tabla de salida.

APPEND

opcional

Anexa la salida del comando al final de un archivo existente en lugar de sobrescribir el archivo.

Nota

Debe asegurarse de que la estructura de la salida del comando y del archivo existente sean idénticas:

  • los mismos campos
  • el mismo orden de campos
  • los campos coincidentes son de la misma longitud
  • los campos coincidentes tienen el mismo tipo de datos

Analytics anexa la salida a un archivo existente sin importar cuál sea su estructura. Si la estructura de la salida y la del archivo existente no coinciden, es posible que los datos que se obtengan estén incompletos, mezclados o sean imprecisos.

MERSENNE_TWISTER

opcional

Nota

Métodos de selección aleatorio y de celda únicamente.

El generador de números aleatorios de Analytics utiliza el algoritmo Mersenne-Twister.

Si se omite MERSENNE_TWISTER, se utiliza el algoritmo predeterminado de Analytics.

Nota

Solo seleccione el algoritmo predeterminado de Analytics si requiere tener compatibilidad con versiones anteriores de los scripts de Analytics o con los resultados de muestras creados antes de la versión 12 de Analytics.

LOCAL

opcional

Guarda el archivo de salida en la misma ubicación que el proyecto de Analytics.

Nota

Aplicable únicamente al ejecutar el comando en una tabla de servidor con un archivo de salida que es una tabla de Analytics.

Ejemplos

Extraer una muestra de unidad monetaria

Va a utilizar el muestreo de unidad monetaria para estimar el importe total de información monetaria errónea en una cuenta que contiene facturas.

Después de calcular un tamaño de muestra estadísticamente válido, está preparado para extraer la muestra. Va a utilizar el método de selección de intervalo fijo.

El siguiente ejemplo:

  • Toma muestras de la tabla de Analytics abierta, sobre la base de un campo de importe de la transacción
  • Utiliza el método de selección del intervalo fijo con un valor de intervalo de $6.283,33
  • Especifica que el primer registro seleccionado contiene la unidad monetaria 100.000 (el número de centavos es $1.000)
  • Utiliza un corte de estrato de $5.000
  • Incluye el registro completo en la tabla de salida.
SAMPLE ON Importe INTERVAL 6283,33 FIXED 1000,00 CUTOFF 5000,00 RECORD TO "Ar_muestra_unidad_monetaria" OPEN

Observaciones

Nota

Si desea obtener más información sobre la forma en la que funciona este comando, consulte Guía de ayuda.

Guía de creación de scripts de ACL 14.1