Ordenar e indexar
A classificação e a indexação são dois métodos diferentes para ordenar dados sequencialmente em tabelas. Alguns comandos do Analytics exigem que a entrada seja antes ordenada ou indexada. A ordenação de dados também pode ser uma operação analítica útil por si só, evidenciando padrões e anomalias.
| Operação | Descrição |
|---|---|
| Ordenação |
Ordenar uma tabela fisicamente reordena os dados em ordem sequencial e envia os resultados para uma nova tabela do Analytics. |
| Indexação |
Indexar não altera a ordem física subjacente dos dados. Em vez disso, cria um arquivo de índice separado que faz referência aos registros em uma tabela, o que permite o acesso aos registros em ordem sequencial em vez de ordem física. Os dados em uma exibição são reordenados de acordo com um índice somente enquanto o índice está ativo. |
Ordenação de dados como prerrequisito para outras operações
Como os computadores processam arquivos em sequência, iniciando pelo primeiro registro, a ordenação sequencial de dados é um pré-requisito para vários testes analíticos e outras operações no Analytics. Operações em várias tabelas, como associações ou relações, podem exigir a ordenação ou indexação de campos-chave.
Outros testes e operações do Analytics podem não precisar de dados ordenados, mas sua execução será muito mais rápida se os dados forem ordenados ou indexados antes.
Devo ordenar ou indexar?
A escolha entre ordenar ou indexar pode depender da tarefa específica que você quer executar. Por exemplo:
- Ordenação pode ser uma opção melhor para trabalhos investigativos porque ela cria uma nova tabela que pode servir como base para a análise subsequente
- Indexar pode ser uma opção melhor para realizar trabalhos informacionais ou preliminares porque permite alternar rapidamente entre diferentes representações dos dados na tabela ativa
Vantagens e as desvantagens da ordenação e da indexação
A tabela a seguir compara as vantagens e desvantagens da ordenação e da indexação e lista operações que exigem ordenação ou indexação como prerrequisito.
|
|
Ordenação |
Indexação |
|---|---|---|
|
Envia resultados para uma nova tabela do Analytics fisicamente |
Sim |
Não |
|
Reorganiza os dados fisicamente |
Sim |
Não |
|
Velocidade da operação |
Mais lenta |
Mais rápida |
|
Espaço em disco necessário para o processamento |
Mais |
Menos |
|
Tamanho de arquivo resultante |
Maior |
Menor |
|
Processamento subsequente do arquivo ordenado ou indexado |
Mais rápida |
Mais lenta |
|
Pesquisando campos de caracteres |
Mais lenta |
Mais rápida |
|
Pré-requisito para |
|
|
A opção Ordem de Classificação e as sequências de classificação
A opção Ordem de Classificação (Ferramentas > Opções > Tabela) especifica a sequência de classificação (agrupamento) dos dados de caracteres. A opção especificada define a sequência de classificação usada ao ordenar ou indexar registros, ou testar a ordem sequencial, usando um campo de caracteres.
O que é uma sequência de classificação?
Uma sequência de classificação é como um modelo usado pelo Analytics para comparar o primeiro ou os primeiros caracteres de um valor em um campo de caracteres ao ordenar, indexar, testar a ordem sequencial ou executar uma classificação rápida.
A tabela abaixo mostra a configuração padrão da Ordem de Classificação do Analytics e a sequência de classificação associada.
|
Edição do Analytics |
Padrão da Ordem de Classificação |
Sequência de ordenação associada |
|---|---|---|
|
não unicode |
Padrão do Sistema (ASCII) |
|
|
Unicode |
Combinar linguagens (UCA) (Algoritmo de colação Unicode) |
|
Alteração da Ordem de Classificação
É possível alterar a Ordem de Classificação para uma linguagem diferente se ela corresponder melhor aos dados analisados. Na edição para Unicode do Analytics, também é possível fazer essa alteração em uma base de comandos usando o parâmetro ISOLOCALE na linha de comando ou no script.
Modificação da sequência de classificação
Na edição não Unicode do Analytics, ao selecionar um idioma diferente, é possível modificar a sequência de classificação associada, alterando a ordem dos caracteres na caixa de texto Ordem de classificação.
Existe a opção de criar uma sequência de ordenação personalizada, selecione Personalizar no campo Ordem de Classificação e especificando uma sequência, ou inserindo SET ORDER <TO> valores na linha de comando ou um script e especificando uma sequência. Sejam quais forem os caracteres especificados, serão ordenados antes de todos os outros caracteres e na sequência especificada. Por exemplo, é possível especificar que letras maiúsculas e minúsculas devem ser combinadas inserindo os valores aAbBcC.... Se SET ORDER for especificado, retornará a sequência da ordenação para a definição padrão.
Sequência de classificação padrão baseada na ordem de bytes
A sequência de classificação padrão para idiomas individuais é derivada da ordem de bytes de cada caractere em seu conjunto de caracteres. É possível exibir a ordem por bytes dos caracteres em conjuntos de caracteres usando o Windows Character Map.