Amostragem clássica de variáveis
A amostragem clássica de variáveis é um método de amostragem estatística para estimar:
- o valor total auditado de uma conta ou classe de transações
- o valor total de uma afirmação incorreta monetária em uma conta ou classe de transações
A amostragem clássica de variáveis funciona melhor com dados financeiros que têm as seguintes características:
um número de moderado a grande de afirmações incorretas Por exemplo, 5% ou mais de itens com informações incorretas. |
é possível haver afirmações exageradas ou insuficientes |
é possível haver itens sem valor monetário |
Dica
Para obter uma introdução prática ao processo completo de amostragem clássica de variáveis no Analytics, consulte Tutorial da amostragem clássica de variáveis.
Nota
Além de dados financeiros, você pode usar a amostragem clássica de variáveis com quaisquer dados numéricos que tenham uma característica variável como, por exemplo, quantidade, unidades de tempo ou outras unidades de medida.
Como funciona?
A amostragem clássica de variáveis permite selecionar e analisar um pequeno subconjunto dos registros de uma conta e, com base no resultado, estimar o valor auditado total da conta e o valor total de afirmações incorretas monetárias.
As estimativas são calculadas como intervalos:
- A estimativa de ponto é o ponto médio do intervalo.
- O limite superior e o limite inferior são os dois pontos nas extremidades do intervalo.
Você também pode optar por calcular uma estimativa ou intervalo unilateral com uma estimativa de ponto e somente um limite superior ou somente um limite inferior.
Você compara o intervalo estimado com o valor contábil da conta ou com o valor de afirmações incorretas que você avalia como relevante e toma uma decisão em relação à conta.
A amostragem clássica de variáveis permite afirmações como:
- Há uma probabilidade de 95% de que o valor auditado real da conta está entre 45.577.123,95 e 46.929.384,17, um intervalo que contém o valor contábil da conta de 46.400.198,71. Portanto, os da conta estão declarados corretamente.
- Há uma probabilidade de 95% de que a afirmação incorreta no saldo da conta está entre – 813.074,76 e 539.185,46, o que não excede a precisão monetária de ±928.003,97. Portanto, os da conta estão declarados corretamente.
Visão geral do processo de amostragem clássica de variáveis
Cuidado
Não deixe de calcular um tamanho da amostra válido.
Se você usar uma estimativa para o tamanho e passar diretamente à obtenção da amostra de registros, será altamente provável que a projeção dos resultados da análise seja inválida e a que a sua conclusão final seja incorreta.
O processo de amostragem clássica de variáveis envolve as seguintes etapas gerais:
- Preparar (planejar) a amostra clássica de variáveis
- Obter a amostra de registros
- Execute os procedimentos de auditoria pretendidos nos dados amostrados.
- Avalie o seguinte:
- se o valor auditado dos dados amostrados, quando projetado para a conta como um todo, está dentro de um intervalo aceitável do valor contábil registrado
- se os níveis observados de afirmação incorreta monetária nos dados amostrados representam um valor de afirmação incorreta aceitável ou inaceitável na conta como um todo
Limitação de tamanho numérico
Vários cálculos internos ocorrem durante a fase de preparação da amostragem clássica de variáveis. Esses cálculos permitem números com um comprimento máximo de 17 dígitos. Se o resultado de qualquer cálculo exceder 17 dígitos, o resultado não será incluído na saída e você não poderá continuar com o processo de amostragem.
Os números dos dados de origem com menos de 17 dígitos podem produzir resultados de cálculos internos que excedem 17 dígitos.
Os valores são mantidos e preenchidos entre as etapas
Quando você usa o Analytics para amostragem clássica de variáveis, insere informações em três caixas de diálogo separadas e executa os comandos associados nesta ordem:
- Caixa de diálogo Preparar o CVS
- Caixa de diálogo Amostrar o CVS
- Caixa de diálogo Avaliar o CVS
Conforme você avança nesse processo, as informações de uma caixa de diálogo são preenchidas na próxima caixa de diálogo. O preenchimento economiza um trabalho considerável e remove o risco de inserir acidentalmente valores incorretos e invalidar a amostra.
Considerações importantes
- Alteração dos valores preenchidos normalmente, você não deve alterar nenhum dos valores preenchidos. A alteração dos valores preenchidos pode negar a validade estatística do processo de amostragem.
Cuidado
Atualize os valores preenchidos somente se você tiver o conhecimento estatístico para entender o efeito da alteração.
-
Armazenamento temporário de valores os valores que preenchem automaticamente as caixas de diálogo Amostrar o CVS e Avaliar o CVS são armazenados temporariamente e excluídos quando você fecha o projeto do Analytics.
Diretrizes
Siga estas diretrizes para que o processo completo do CVS transcorra da melhor forma possível:
- Não feche o projeto do Analytics entre as etapas Preparar o CVS e Amostrar o CVS.
Dica
Se fechar o projeto, você poderá restaurar os valores temporários do CVS ao voltar a inserir as informações necessárias na caixa de diálogo Preparar o CVS ou ao executar novamente o comando CVSPREPARE a partir do log.
- Opcional. Depois de executar Preparar o CVS e Amostrar o CVS, salve os comandos em um script. Você pode copiar os comandos da exibição de saída ou do log.
Você também pode copiar a versão preliminar do comando CVSEVALUATE incluída na saída de Amostrar o CVS.
Se necessário, você pode executar novamente um ou mais dos comandos de CVS do script. Digite COMMENT antes de qualquer comando que você não deseja executar. Provavelmente, será necessário atualizar a versão preliminar do comando CVSEVALUATE. Para obter mais informações, consulte Execução da amostragem clássica de variáveis.
Estratificação
A amostragem clássica de variáveis oferece a opção de estratificar numericamente os registros em uma população antes de obter uma amostra.
O benefício da estratificação é que muitas vezes reduz drasticamente o tamanho da amostra necessário e mantém a validade estatística. Um tamanho de amostra reduzido significa a redução do trabalho de análise de dados necessário para alcançar seu objetivo.
Como funciona?

A estratificação funciona dividindo a população em diversos subgrupos, ou níveis, denominados estratos. Idealmente, os valores em cada estrato são relativamente homogêneos.
Um algoritmo estatístico (o método Neyman) define os limites entre os estratos. O algoritmo posiciona os limites para minimizar a dispersão de valores dentro de cada estrato, o que reduz o efeito da variação populacional. A redução da variação, ou do "spread", reduz o tamanho da amostra necessário. Por projeto, o intervalo de cada estrato não é uniforme.
O número de amostras necessário é então calculado e totalizado por estrato, em vez de para toda a população não estratificada. Para o mesmo conjunto de dados, a abordagem estratificada resulta normalmente em um tamanho de amostra muito menor que a abordagem não estratificada.
Pré-estratificação usando células
Como parte do processo de estratificação, você especifica o número de células a ser usado para pré-estratificar a população. As células são divisões numéricas uniformes, mais limitadas que os estratos.
Um algoritmo estatístico usa a contagem de registros em cada célula como parte do cálculo que atribui limites ideais de estratos. As células não são retidas na saída estratificada final.
O número de células especificado deve ser, no mínimo, o dobro do número de estratos especificado.
Nota
As células de pré-estratificação e as células usadas no método de seleção de amostra por células não são a mesma coisa.
Excesso de uma coisa boa
A estratificação é uma ferramenta poderosa para gerenciar o tamanho da amostra, mas você deve ter cuidado ao especificar o número de estratos e o número de células.
Para começar, experimente:
- 4 a 5 estratos
- 50 células
Depois de um certo ponto, o aumento do número de estratos ou de células tem pouco ou nenhum efeito sobre o tamanho da amostra. No entanto, esses aumentos podem afetar negativamente o projeto da amostra ou o desempenho do Analytics quando grandes conjuntos de dados são estratificados.
Em relação ao projeto da amostra, quando alcança a etapa de avaliação, você precisa ter um número mínimo de afirmações incorretas em cada estrato para projetar de forma confiável as afirmações incorretas para toda a população. Se você tem muitos estratos em relação ao número de afirmações incorretas, podem ocorrer problemas com a projeção.
O estrato de certeza
A definição de um estrato de certeza é outra opção de estratificação disponível.
O uso de um estrato de certeza tem dois benefícios:
- Itens individualmente significativos, ou itens de alto valor, são incluídos automaticamente na amostra e não correm o risco de serem excluídos pelo método de seleção aleatório.
- Os itens do estrato de certeza são removidos do cálculo do tamanho da amostra. Devido à sua natureza, itens de alto valor, se incluídos no cálculo, poderão aumentar consideravelmente a variação populacional e o tamanho da amostra necessário.
Definição de um estrato de certeza
Para definir um estrato de certeza, você especifica valor de limite numérico. Todos os valores contábeis de campo-chave maiores ou iguais ao valor de limite são selecionados e incluídos automaticamente na amostra. O restante da população é amostrado usando o método de seleção aleatório.
Nota
Quanto menor a definição do valor limite do estrato de certeza, maior será o tamanho da amostra geral.
Você deve evitar definir um valor limite muito baixo sem necessidade. Consulte um especialista em amostragem se não tiver certeza sobre a definição desse valor.
Estratos de certeza superior e inferior
A opção de estrato de certeza no Analytics define apenas um estrato de certeza superior. Números maiores ou iguais ao valor do limite são incluídos no estrato de certeza.
Além disso, pode ser necessário um estrato de segurança inferior para incluir automaticamente grandes valores negativos na amostra e reduzir a variação.
Para criar um estrato de certeza inferior, você pode usar um dos dois métodos a seguir:
- Antes de iniciar o processo de amostragem clássica de variáveis, use um filtro e extraia todos os valores da população que são menores ou iguais a um valor limite inferior.
Você pode manter esses registros em uma tabela separada ou anexá-los à tabela de saída que contém as amostras do resto da população.
Para obter mais informações, consulte Extrair e anexar dados.
- Durante as etapas de Preparar o CVS e Amostrar o CVS, use uma condição If para filtrar itens do estrato de segurança inferior.
Cuidado
Este método é mais arriscado e menos recomendado porque você deve se lembrar de aplicar consistentemente a condição If nas duas etapas e durante qualquer repetição subsequente das etapas.
Como a amostragem clássica de variáveis seleciona registros
A amostragem clássica de variáveis usa o processo a seguir para selecionar registros de amostra de uma tabela do Analytics:
- Você especifica um campo numérico como base da amostragem. A unidade de amostragem é um registro individual na tabela.
- Usando o método de seleção aleatório, o Analytics seleciona amostras entre os registros da tabela.
- Se você estiver usando a estratificação, um número aproximadamente igual de registros será selecionado aleatoriamente em cada estrato.
- Se você não estiver usando a estratificação, os registros serão selecionados aleatoriamente em toda a população.
- Os registros selecionados são incluídos na tabela de saída da amostragem.
Exemplo
Em uma tabela com 300 registros, dividida em 3 estratos, o Analytics poderia selecionar os seguintes números de registro:
Estrato 1 | Estrato 2 | Estrato 3 |
---|---|---|
|
|
|
Em uma tabela não estratificada com 300 registros, o Analytics poderia selecionar os números de registro mostrados abaixo. Você pode ver que os números de registro selecionados são distribuídos de forma menos uniforme.
Nota
Os números de registro abaixo são agrupados em três colunas para facilitar a comparação, mas as colunas não representam estratos.
|
|
|
Seleção da amostra sem tendências
A amostragem clássica de variáveis não apresenta tendências e não é baseada nos valores de um registro. Cada o registro tem a mesma chance de ser selecionado para ser incluído na amostra. Registros com os valores de US$ 1.000, US$ 250 e US$ 1 têm a mesma probabilidade de serem selecionados.
Em outras palavras, a probabilidade de qualquer registro ser selecionado não tem relação ao tamanho do valor que contém.