Realizar muestreo por unidad monetaria
Usted puede crear una tabla nueva que contenga una muestra representativa de los datos monetarios en la tabla activa.
El muestreo por unidad monetaria es apropiado si le interesa el importe total de la información errónea monetaria en un archivo.
Nota
Este procedimiento no incluye el filtrado (enunciados IF) o parámetros de alcance ya que aplicar estas opciones compromete la validez de la muestra.
Pasos
Nota
No incluya el separador de mil ni los signos de porcentaje al especificar los valores. Estos caracteres impiden la ejecución del comando o provocan errores.
- En el Navegador, abra la tabla de la que desee extraer una muestra.
- Opcional. Si tiene la intención de usar el método de selección Aleatorio, o de generar perfiles o estadísticas según el campo de muestra.
- Seleccione Muestreo > Muestreo por unidad monetaria/registro > Muestra.
- En la ficha Principal, seleccione MUS.
- Seleccione el campo para la muestra de la lista desplegable Muestreo en.
- En el panel Parámetros de muestra, especifique un método de selección de muestras:
- Intervalo fijo
- Celda
- Aleatorios
Nota
No use el método de selección aleatoria con muestreo por unidad monetaria si va a usar Analytics para evaluar cualquier información errónea detectada en la muestra resultante.
Para evaluar las muestras por unidad monetaria se requiere usar el intervalo fijo o los métodos de selección de celdas.
- Ingrese los parámetros de muestra para el método de selección que eligió:
Método de selección Parámetros de la muestra Intervalo fijo - Intervalo
- Inicio (opcional)
- Corte (opcional)
Celda - Intervalo
- Semilla (opcional)
- Corte (opcional)
- Algoritmo: deje Mersenne Twister seleccionado
Aleatorio - Tamaño
- Semilla (opcional)
- Población
- Algoritmo: deje Mersenne Twister seleccionado
Nota
Los parámetros de muestreo se explican de manera detallada a continuación.
- En el cuadro de texto En, especifique el nombre de la tabla Analytics que contendrá los resultados de salida.
- En la ficha Más, seleccione uno de los siguientes:
RegistroSe incluye todo el registro en la tabla de salida.
Campos Solo los campos seleccionados se incluyen en la tabla de salida.
- Si escoge Campos, seleccione los campos que desea incluir en la tabla de salida desde la lista Extraer campos.
- Opcional. Seleccione una o más de las siguientes opciones:
- Submuestra
- Orden de selección de reporte
- Sin repeticiones
Nota
Las opciones se explican a continuación.
Submuestra está disponible sólo si selecciona Salida de campos.
Orden de selección de reporte está disponible solo si se selecciona tanto el método de selección Aleatorio como la salida Campos.
- Haga clic en Aceptar.
Opciones del cuadro de diálogo Muestra
Las tablas que figuran a continuación proporcionan información detallada acerca de las opciones del cuadro de diálogo Muestra.
Ficha Principal
Opciones: Cuadro de diálogo Muestra | Descripción |
---|---|
MUS Registro |
El tipo de muestra:
|
Muestreo en |
El campo de muestra numérico.
|
Intervalo fijo |
Especifica que se utiliza el método de intervalo fijo para la selección de la muestra. Las muestras se seleccionan en base a un valor de intervalo y al número de inicio que usted especifique. Si desea obtener más información, consulte Método de selección de intervalo fijo. Si seleccionó Intervalo fijo escriba los siguientes valores:
|
Celda |
Especifica que se utiliza el método de celda para la selección de la muestra. El conjunto de datos se divide en varias celdas o grupos de igual tamaño y se selecciona una muestra de forma aleatoria de cada celda. El valor del intervalo indica el tamaño de cada celda. Si desea obtener más información, consulte Método de selección de celdas. Si seleccionó Celda escriba los siguientes valores:
|
Aleatorios |
Especifica que se utiliza el método aleatorio para la selección de la muestra. Las muestras se seleccionan de forma aleatoria del conjunto de datos completo. Si desea obtener más información, consulte Método de selección aleatorio. Si seleccionó Aleatorio escriba los siguientes valores:
|
Si |
¡Precaución! No cree un enunciado IF ni filtre registros durante el muestreo. Si lo hace, pondrá en riesgo la validez de la muestra. Si desea obtener más información, consulte Muestreo condicional. |
En | El nombre y la ubicación de la tabla de salida.
Independientemente del lugar en que guarde la tabla de salida, esta se agrega al proyecto abierto si ya no está en el proyecto. Si Analytics pre-completa un nombre de tabla, puede aceptar el nombre pre-completado o cambiarlo. |
Local |
Si está conectado a una tabla de servidor, especifica dónde guardar la tabla de salida.
|
Utilizar la tabla de salida | Especifica si una tabla de Analytics que contiene resultados de salida se abre automáticamente al finalizar la operación |
Ficha Más
Opciones: Cuadro de diálogo Muestra | Descripción |
---|---|
Panel de alcance |
¡Precaución! No limite qué registros se procesan durante el muestreo. Si lo hace, pondrá en riesgo la validez de la muestra. Si desea obtener más información, consulte Muestreo condicional. |
Registro Campos |
Especifica si la tabla de salida incluye el registro completo o los campos seleccionados. Si escoge Campos, complete una de las siguientes acciones: Seleccione el campo o los campos para extraer en la lista Extraer campos. Haga clic en Extraer campos para seleccionar el campo o los campos, o para crear una expresión. El orden en que seleccione los campos es el orden en el cual aparecen las columnas en los resultados. Si está anexando los resultados a una tabla de Analytics existente, la selección y el orden de columna deben ser idénticos a la selección de columna y el orden en la tabla existente. |
Submuestra Orden de selección de reporte Sin repeticiones |
(Opcional) Opciones de muestreo adicionales. Puede seleccionar una o más de las siguientes opciones:
Nota Submuestra está disponible sólo si selecciona Salida de campos. Orden de selección de reporte está disponible solo si se selecciona tanto el método de selección Aleatorio como la salida Campos. Con Sin repeticiones, los registros seleccionados se vuelven no elegibles para las selecciones posteriores, lo cual puede reducir el tamaño de la muestra. Debe considerar sobremuestrear el conjunto de datos para compensar los datos. Si desea obtener más información, consulte Selección de muestras sin repeticiones. |
Anexar al archivo existente | Especifica que los resultados de salida se anexan (agregan) al final de una tabla de Analytics existente. Nota Se recomienda dejar Anexar a archivo existente sin seleccionar si no está seguro de que los resultados de la salida y la tabla existente tengan una estructura de datos idéntica. Si desea más información acerca de la anexión y la estructura de datos, consulte Anexar resultados a archivos de texto y tablas de Analytics. |
Aceptar | Ejecuta la operación. Si aparece el mensaje de sobrescritura, seleccione la opción adecuada. Si espera que aparezca la opción Anexar, pero esta no aparece, haga clic en No para cancelar la operación y consulte Anexar resultados a archivos de texto y tablas de Analytics. |
Opciones de muestreo por unidad monetaria
Para el muestreo por unidad monetaria, puede especificar una o más de las siguientes opciones:
- Límite de estrato superior
- Submuestra
- Selección de muestras sin repeticiones
Límite de estrato superior
Nota
El corte de estrato superior está disponible únicamente para muestreo por unidad monetaria que use los métodos de selección por intervalo fijo o por celdas.
El corte de estrato superior es un método adicional que Analytics utiliza para desviar el muestreo por unidad monetaria hacia importes más grandes. De forma predeterminada, los importes de los campos de muestra que sean mayores o iguales al valor del intervalo se consideran importes de estrato superior y se incluyen automáticamente en la muestra.
Tanto los importes positivos como los negativos son elegibles para inclusión automática porque se considera el valor absoluto del importe.
Tenga en cuenta que mientras mayor sea el importe de selecciones automáticas, mayor será el tamaño de la muestra.
Opcionalmente puede especificar un valor de corte de estrato superior que sea mayor o menor al valor del intervalo:
El corte del estrato superior es más elevado que el valor del intervalo | Reduce la probabilidad de que se incluyan importes más grandes automáticamente en la muestra. Si especifica un corte mayor que el importe positivo o negativo más grande en el campo de muestra, no se selecciona ningún importe automáticamente. |
---|---|
El corte del estrato superior es inferior al valor del intervalo | Reduce la probabilidad de que se incluyan importes más grandes automáticamente en la muestra. Si no se selecciona ningún valor automáticamente utilizando el corte de estrato superior predeterminado, puede ajustar el valor de corte hacia abajo para seleccionar automáticamente algunos de los importes más grandes en el campo de muestra. Precaución Si especifica un valor de corte demasiado pequeño en relación con los importes del campo de muestra, la cantidad de importes seleccionados automáticamente será demasiado grande, lo cual va en contra del propósito del muestreo. |
Las selecciones de estrato superior y el importe registrado en el log
Al realizar una muestra por unidad monetaria, la cantidad de selecciones de estrato superior y el importe total de estrato superior se muestran en el log.
Ejemplo
El log muestra que 8 de los 93 registros seleccionados son de estrato superior, lo cual representa $33.153,55 del valor absoluto del campo de muestreo numérico.
Tamaño de muestra = 93 (estrato superior 8), de un total de 772 registros muestreados Población: 585674,41, Estrato superior: 33153,55, Otro: 552520,86
Submuestra
Nota
El submuestreo solo está disponible para el muestreo por unidad monetaria utilizando la salida de campo.
En algunos casos, cada importe en un campo de muestra representa un total de varias transacciones separadas. Si desea realizar procedimientos de auditoría en una sola transacción de cada importe total muestreado, puede usar el submuestreo para seleccionar aleatoriamente transacciones individuales.
Al seleccionar Submuestra en el cuadro de diálogo Muestra, la muestra resultante incluye el campo SUBSAMPLE. Este campo contiene importes que representan la diferencia entre el importe total y la unidad monetaria real usada para seleccionar el importe total.
Ejemplo
$12.455 | (importe total) |
- $4.620 | (unidad monetaria seleccionada) |
= $7.835 | (importe que se muestra en el campo SUBSAMPLE) |
Para completar el proceso, debe seleccionar la transacción que contiene el dólar número 7,835 en el saldo acumulativo de transacciones para ese importe particular.
Nota
Cualquier importe de corte de estrato superior en la muestra tendrá “0,00” en el campo SUBSAMPLE porque se incluirá automáticamente en la muestra y no habrá ninguna unidad monetaria involucrada en su selección.
Selección de muestras sin repeticiones
En el muestreo por unidad monetaria se puede seleccionar el mismo registro más de una vez. Cada importe en el campo de muestra contiene múltiples unidades monetarias, y se pueden seleccionar dos o más unidades monetarias pertenecientes al mismo importe, lo cual significa que el registro que contiene el importe se selecciona varias veces.
Puede evitar las múltiples selecciones del mismo registro si selecciona Sin repeticiones en el cuadro de diálogo Muestra. La muestra resultante no contendrá duplicados. Si embargo, la cantidad de registros muestreados puede ser más pequeña que el tamaño de la muestra calculado por Analytics. Para compensar, puede sobremuestrear usando uno de los siguientes métodos para aumentar el tamaño de la muestra:
-
Métodos de selección de intervalo fijo o de celda:
- disminuya el tamaño del intervalo
- ajuste el valor de corte de estrato superior para seleccionar automáticamente una mayor cantidad de registros
- Método de selección aleatoria aumenta el tamaño de la muestra especificado