Verificar duplicidades

Valores duplicados em um ou mais campos, ou registros duplicados, podem ser resultado de erro de entrada de dados ou atividades fraudulentas como divisão de transação de cartões de crédito para evitar medidas de segurança.

Requisitos para valores únicos

Campos que jamais devem conter duplicidades são aqueles cujos valores identificam unicamente registros. Por exemplo, uma tabela de números de funcionário nunca deve ter números de funcionário duplicados, pois cada valor deve identificar um único funcionário.

Duplicidades válidas

Valores duplicados também podem ser válidos. Por exemplo, uma tabela de transações pode ter números de clientes duplicados decorrentes de um mesmo cliente ter várias transações.

Tipos diferentes de teste de duplicidades

Você pode utilizar o Analytics para testar a existência de duplicidades das seguintes formas:

Escopo do teste Use esse teste quando:
Um campo

Todos os valores de um determinado campo devem ser únicos, como números de funcionário ou de cheque.

Dois ou mais campos em combinação

A singularidade não é um requisito para nenhum dos campos considerados isoladamente, mas é necessária para os campos combinados.

Exemplo

Em um arquivo de folha de pagamento que cobre um ano, o campo de número de funcionário e o campo de data de pagamento conterão uma série de duplicidades. Funcionários são pagos a cada duas semanas, e muitos funcionários são pagos na mesma data.

No entanto, um funcionário individual deve constar apenas uma vez em uma data em particular. Se existe uma duplicidade nos campos de número de funcionário e data de pagamento combinados, esse funcionário pode ter sido pago duas vezes pelo mesmo período de pagamento.

Todos os campos de um registro

Verificar a existência de registros inteiro duplicados, em que todos os campos do registro são duplicados. Registros duplicados inteiros podem ser o resultado de entradas errada de dados, ou de outras irregularidades transacionais.

Etapas

Você pode testar um ou mais campos na tabela ativa para detectar se existem valores ou registros inteiros duplicados.

Remover duplicidades

A operação de sumarização pode ser utilizada para remover valores ou registros duplicados de um conjunto de dados e salvar os registros únicos remanescentes em uma nova tabela do Analytics.

Ajuda do Analytics 14.1