Analisando dados

A "análise de dados" é um conceito amplo que abrange uma grande variedade de processos e técnicas diferentes. Pode haver mais de uma maneira de alcançar o mesmo objetivo de análise de dados. Muitas vezes, o processo geral é interativo, o que exige modificar a abordagem inicial de acordo com as informações descobertas ao longo do processo.

Análise de dados eficaz

Na essência, a análise de dados é o processo de encontrar respostas para questões sobre dados. O Analytics oferece vários comandos e outras ferramentas que você pode usar para obter insights gerais sobre os dados investigados e para responder a perguntas específicas. No entanto, isso não significa que você pode clicar dois ou três botões no Analytics e obter magicamente todas as respostas de análises de dados.

Uma análise de dados eficaz exige:

  • compreensão da natureza dos dados
  • formulação de objetivos de análise específicos
  • aplicação correta das ferramentas

O Analytics pode ampliar consideravelmente suas habilidades de análise de dados, mas não as substitui.

Comandos e ferramentas de análises de dados no Analytics

A tabela abaixo categoriza comandos e ferramentas do Analytics por área de análise de dados. As categorias não devem ser entendidas como absolutas. Você pode encontrar um uso eficaz de um comando fora de sua categoria. Alguns comandos, como Sort e Join, têm uma função específica que não é essencialmente analítica. Entretanto, em algumas situações, podem oferecer insights analíticos.

Nota

Normalmente, as análises de dados além de um nível básico exigem o uso de vários comandos para trabalhar progressivamente na direção do objetivo da análise, em vez de usar um único comando isolado.

Área de análise de dados Comando ou ferramenta Descrição

Características gerais

Verificar

Contagem

Total

Perfil

Estatísticas

Valores discrepantes

Ordenar

Índice

Use esses comandos para descobrir características gerais de um conjunto de dados, incluindo:

  • validade de dados
  • contagem de registros
  • valores totais
  • valores mínimo, máximo e médio
  • valores de desvio padrão, mediana, moda e quartis
  • valores discrepantes
  • intervalos
  • distribuição de valores negativos e positivos
  • padrões
Confiabilidade/precisão campos calculados Use campos calculados para recalcular e testar a precisão de valores calculados em um conjunto de dados, como valores totais incluindo impostos
Isolamento

filtragem

pesquisa

Use a filtragem para restringir um conjunto de dados ou um processamento de dados a um subconjunto dos registros de interesse

Use a pesquisa para localizar valores específicos em um conjunto de dados

Ordem sequencial Sequência Teste se os dados estão ordenados sequencialmente e identifique itens fora de sequência
Completude Falhas Verifique se todos os registros em uma sequência, como uma série de verificações ordenada sequencialmente, estão presentes e identifique a localização de quaisquer lacunas na sequência
Exclusividade Duplicidades Identifique valores ou itens duplicados em um campo ou registros totalmente duplicados
Inexatidão Duplicidades parciais Identifique valores quase idênticos que podem ser uma referência à mesma entidade do mundo real

Distribuição de frequência

Concentração de materialidade

Estratificar

Período

Classificar

Sumarizar

Tabulação cruzada

Histograma

Cluster

Agrupe registros e determine quantos registros e quanto valor estão concentrados por intervalo numérico ou cluster, por período ou por identificadores de registro como códigos de localização, números de fornecedores/clientes ou identificadores de produto

Também é útil para identificar valores discrepantes

Comparar

Associar

Associação parcial

Relacionar

Combine tabelas para descobrir se os registros têm ou não correspondência entre tabelas, como nas tabelas de faturas e pedidos
Anomalia numérica Benford Descubra dados numéricos anômalos testando dígitos à esquerda para detectar variação em relação à distribuição de Benford esperada