Amostragem clássica de variáveis

A amostragem clássica de variáveis é um método de amostragem estatística para estimar:

  • o valor total auditado de uma conta ou classe de transações
  • o valor total de uma afirmação incorreta monetária em uma conta ou classe de transações

A amostragem clássica de variáveis funciona melhor com dados financeiros que têm as seguintes características:

um número de moderado a grande de afirmações incorretas

Por exemplo, 5% ou mais de itens com informações incorretas.

é possível haver afirmações exageradas ou insuficientes
é possível haver itens sem valor monetário

Dica

Para obter uma introdução prática ao processo completo de amostragem clássica de variáveis no Analytics, consulte Tutorial da amostragem clássica de variáveis.

Nota

Além de dados financeiros, você pode usar a amostragem clássica de variáveis com quaisquer dados numéricos que tenham uma característica variável como, por exemplo, quantidade, unidades de tempo ou outras unidades de medida.

Como funciona?

A amostragem clássica de variáveis permite selecionar e analisar um pequeno subconjunto dos registros de uma conta. Com base nos resultados da análise do subconjunto, você pode estimar o valor auditado total da conta e o valor total de afirmações incorretas monetárias.

As duas estimativas são calculadas como intervalos:

  • A estimativa de ponto é o ponto médio de um intervalo.
  • O limite superior e o limite inferior são os dois pontos nas extremidades de um intervalo.

    Você também pode optar por calcular uma estimativa ou intervalo unilateral com uma estimativa de ponto e somente um limite superior ou somente um limite inferior.

Você compara o intervalo estimado com o valor contábil da conta ou com o valor de afirmações incorretas que você avalia como relevante e toma uma decisão em relação à conta.

A amostragem clássica de variáveis permite afirmações como:

  • Há uma probabilidade de 95% de que o valor auditado real da conta está entre 45.577.123,95 e 46.929.384,17, um intervalo que contém o valor contábil da conta de 46.400.198,71. Portanto, os da conta estão declarados corretamente.
  • Há uma probabilidade de 95% de que a afirmação incorreta no saldo da conta está entre – 813.074,76 e 539.185,46, o que não excede a precisão monetária de ±928.003,97. Portanto, os da conta estão declarados corretamente.

Visão geral do processo de amostragem clássica de variáveis

Cuidado

Não deixe de calcular um tamanho da amostra válido.

Se você usar uma estimativa para o tamanho e passar diretamente à obtenção da amostra de registros, será altamente provável que a projeção dos resultados da análise seja inválida e a que a sua conclusão final seja incorreta.

O processo de amostragem clássica de variáveis envolve as seguintes etapas:

  1. Preparar (planejar) a amostra clássica de variáveis
  2. Obter a amostra de registros
  3. Execute os procedimentos de auditoria pretendidos nos dados amostrados.
  4. Avalie o seguinte:
    • se o valor auditado dos dados amostrados, quando projetado para a conta como um todo, está dentro de um intervalo aceitável do valor contábil registrado
    • se os níveis observados de afirmação incorreta monetária nos dados amostrados representam um valor de afirmação incorreta aceitável ou inaceitável na conta como um todo

Os valores são mantidos e preenchidos entre as etapas

A amostragem clássica de variáveis no Analytics exige que você insira informações em três caixas de diálogo separadas e executa os comandos associados nesta ordem:

  1. Caixa de diálogo Preparar o CVS
  2. Caixa de diálogo Amostrar o CVS
  3. Caixa de diálogo Avaliar o CVS

Conforme você avança nesse processo, as informações de uma caixa de diálogo são preenchidas automaticamente na próxima caixa de diálogo. O preenchimento economiza um trabalho considerável e remove o risco de inserir acidentalmente valores incorretos e invalidar a amostra.

No entanto, os valores que preenchem automaticamente as caixas de diálogo Amostrar o CVS e Avaliar o CVS são armazenados temporariamente e excluídos quando você fecha o projeto do Analytics.

Recriar valores da amostragem clássica de variáveis

Em um ambiente de produção, você normalmente executa as diferentes etapas do processo de amostragem clássica de variáveis em momentos distintos. Você pode usar qualquer um dos seguintes métodos para recriar os valores da amostragem clássica de variáveis que são perdidos quando você fecha o Analytics.

O primeiro método é o mais fácil.

  • Salvar os comandos preenchidos

    Os resultados das etapas Preparar o CVS e Amostrar o CVS incluem comandos subsequentes no processo de amostragem clássica de variáveis que são preenchidos com os valores necessários. Salve esses comandos preenchidos em scripts separados para uso posterior.

    Para obter mais informações, consulte Tutorial da amostragem clássica de variáveis.

  • Salvar os comandos executados em scripts

    Após executar as etapas Preparar o CVS e Amostrar o CVS, copie os comandos CVSPREPARE e CVSSAMPLE da área de exibição do Analytics e salve-os em scripts separados. Você pode executar posteriormente esses scripts para recriar os valores de amostragem clássica de variáveis.

    A desvantagem desse método é que você obtém uma amostra redundante de registros.

  • Recuperar os comandos executados do log

    Copie os comandos CVSPREPARE e CVSSAMPLE do log e execute-os novamente na linha de comando para recriar os valores de amostragem clássica de variáveis.

    As desvantagens desse método é que pode ser difícil localizar as instâncias corretas dos comandos no log e você obtém uma amostra redundante de registros.

Alteração de valores preenchidos

Normalmente, você não deve alterar nenhum dos valores preenchidos da amostragem clássica de variáveis. A alteração dos valores preenchidos pode negar a validade estatística do processo de amostragem.

Cuidado

Atualize os valores preenchidos somente se você tiver o conhecimento estatístico para entender o efeito da alteração.

Limitação de tamanho numérico

Vários cálculos internos ocorrem durante a fase de preparação da amostragem clássica de variáveis. Esses cálculos permitem números com um comprimento máximo de 17 dígitos. Se o resultado de qualquer cálculo exceder 17 dígitos, o resultado não será incluído na saída e você não poderá continuar com o processo de amostragem.

Os números dos dados de origem com menos de 17 dígitos podem produzir resultados de cálculos internos que excedem 17 dígitos.

Estratificação

A amostragem clássica de variáveis oferece a opção de estratificar numericamente os registros em uma população antes de obter uma amostra.

O benefício da estratificação é que muitas vezes reduz drasticamente o tamanho da amostra necessário e mantém a validade estatística. Um tamanho de amostra reduzido significa a redução do trabalho de análise de dados necessário para alcançar seu objetivo.

Como funciona?

Os estratos de certeza

A definição de um estrato de certeza é outra opção de estratificação disponível. Você pode definir um estrato de certeza superior, um estrato de certeza inferior ou ambos.

O uso de um estrato de certeza tem dois benefícios:

  • Inclusão automática Itens individualmente significativos, ou itens de alto valor, são incluídos automaticamente na amostra e não correm o risco de serem excluídos pelo método de seleção aleatório.
  • Redução da variação Os itens do estrato de certeza são removidos do cálculo do tamanho da amostra. Devido à sua natureza, itens de alto valor, se incluídos no cálculo, poderão aumentar consideravelmente a variação populacional e o tamanho da amostra necessário.

Definição de um estrato de certeza

Para definir um estrato de certeza, você especifica valor de limite numérico:

  • Limite do estrato de certeza superior Todos os valores contábeis de campo-chave maiores ou iguais ao valor de limite são selecionados e incluídos automaticamente na amostra.
  • Limite do estrato de certeza inferior Todos os valores contábeis de campo-chave menores ou iguais ao valor de limite são selecionados e incluídos automaticamente na amostra.

    O uso de um estrato de certeza inferior será útil se grandes valores negativos estiverem presentes em uma população e você quiser incluí-los automaticamente.

A parcela da população não capturada por um estrato de certeza é amostrada usando o método de seleção aleatória.

Nota

Dependendo da natureza dos dados, o tamanho geral da amostra pode aumentar conforme você diminui o valor de limite do estrato de certeza superior ou aumenta o valor de limite do estrato de certeza inferior.

Você deve evitar definir um valor de limite muito amplo. Consulte um especialista em amostragem se não tiver certeza sobre a definição de um valor de limite.

Coordenação de estratos de certeza superior e inferior

Se você decidir usar um estrato de certeza superior e inferior ao obter uma amostra, precisará considerar como os valores de limite superior e inferior se relacionam:

  • Estratos de certeza não podem se sobrepor Um erro ocorrerá se você especificar um valor de limite superior menor que um valor de limite inferior.
  • Deixe espaço suficiente entre valores de limite Se você especificar valores de limite muito próximos um do outro, a maior parte da população será automaticamente incluída na amostra, o que invalida o propósito da amostragem.

Como a amostragem clássica de variáveis seleciona registros

A amostragem clássica de variáveis usa o processo a seguir para selecionar registros de amostra de uma tabela do Analytics:

  • Você especifica um campo numérico como base da amostragem. A unidade de amostragem é um registro individual na tabela.
  • Usando o método de seleção aleatório, o Analytics seleciona amostras entre os registros da tabela.
  • Se você estiver usando a estratificação, um número aproximadamente igual de registros será selecionado aleatoriamente em cada estrato.
  • Se você não estiver usando a estratificação, os registros serão selecionados aleatoriamente em toda a população.
  • Os registros selecionados são incluídos na tabela de saída da amostragem.

Exemplo

Em uma tabela com 300 registros, dividida em 3 estratos, o Analytics poderia selecionar os seguintes números de registro:

Estrato 1 Estrato 2 Estrato 3
  • 9
  • 13
  • 40
  • 52
  • 78
  • 91
  • 99
  • 104
  • 119
  • 132
  • 144
  • 153
  • 186
  • 211
  • 229
  • 236
  • 248
  • 278
  • 295
  • 296

Em uma tabela não estratificada com 300 registros, o Analytics poderia selecionar os números de registro mostrados abaixo. Você pode ver que os números de registro selecionados são distribuídos de forma menos uniforme.

Nota

Os números de registro abaixo são agrupados em três colunas para facilitar a comparação, mas as colunas não representam estratos.

  • 25
  • 64
  • 79
  • 104
  • 122
  • 127
  • 138
  • 143
  • 175
  • 179
  • 184
  • 191
  • 201
  • 234
  • 241
  • 257
  • 259
  • 281
  • 289
  • 299

Seleção da amostra sem tendências

A amostragem clássica de variáveis não apresenta tendências e não é baseada nos valores de um registro. Cada o registro tem a mesma chance de ser selecionado para ser incluído na amostra. Registros com os valores de US$ 1.000, US$ 250 e US$ 1 têm a mesma probabilidade de serem selecionados.

Em outras palavras, a probabilidade de qualquer registro ser selecionado não tem relação ao tamanho do valor que contém.

Para garantir a seleção dos registros que contêm os maiores valores, consulte Os estratos de certeza.