Conectar ao Apache Cassandra

O Apache Cassandra é um sistema de gerenciamento de banco de dados NoSQL. Use o conector de dados do Analytics para importar dados da sua organização residentes no Cassandra.

Antes de começar

Para conectar-se ao Cassandra, você deve obter:

  • o nome do host do servidor de banco de dados
  • a porta de conexão correta
  • nome do usuário e senha, se usar autenticação

Para obter ajuda na coleta dos pré-requisitos de conexão, entre em contato com o administrador de conectores da sua organização. Se o administrador não conseguir ajudá-lo, você ou o administrador deve entrar em contato com o suporte do conector.

Criar uma conexão ao Cassandra

  1. No menu principal do Analytics, selecione Importar > Banco de dados e aplicativo.
  2. Na guia Novas conexões, na seção Conectores do ACL, selecione seu conector Cassandra.

    Dica

    Você pode filtrar a lista de conectores disponíveis inserindo uma cadeia de pesquisa na caixa Filtrar conexões. Os conectores são listados em ordem alfabética.

  3. No painel Configurações de Conexão de Dados, insira as configurações da conexão e clique em Salvar e conectar na parte inferior do painel.

    Você pode aceitar o Nome de conexão padrão ou inserir um novo nome.

A conexão do conector é salva na guia Conexões existentes. No futuro, você poderá reconectar esse conector usando a conexão salva.

Após estabelecer a conexão, a janela Acesso a Dados abre na Área de preparação e você pode começar a importar dados. Para obter ajuda na importação de dados do conector, consulte Importar dados usando a janela de Acesso a Dados.

Consultar o Cassandra

Uma vantagem do projeto do Apache Cassandra é a capacidade de armazenar dados desnormalizados em um número menor de tabelas. É possível simplificar as transações aproveitando estruturas de dados aninhados, como conjuntos, listas e mapas. No entanto, o Analytics não permite o acesso a esse tipo de dados. Com a renormalização dos dados contidos em coleções (conjuntos, listas e mapas) em tabelas virtuais, o conector permite que os usuários interajam diretamente com os dados, com o Cassandra se encarregando do armazenamento desses dados na forma desnormalizada.

Se uma tabela contiver colunas de coleções, na primeira consulta da tabela, o conector criará as seguintes tabelas virtuais:

  • Uma tabela "base", que contém os mesmos dados da tabela real, exceto pelas colunas de coleções.
  • Uma tabela virtual para cada coluna de coleção, que expande os dados aninhados.

As tabelas virtuais fazem referência aos dados na tabela real, permitindo que o conector acesse os dados desnormalizados. Ao consultar as tabelas virtuais, você pode acessar o conteúdo das coleções do Cassandra usando ODBC.

A tabela base e as tabelas virtuais aparecem como tabelas adicionais na lista de tabelas existentes no banco de dados. A tabela base usa o mesmo nome da tabela real que representa. As tabelas virtuais que representam coleções são nomeadas usando o nome da tabela real, um separador (por padrão, _vt_) e o nome da coluna.

Exemplo

A TabelaExemplo é uma tabela do banco de dados Cassandra que contém uma coluna de chave primária do tipo inteiro denominada cp_int, uma coluna de lista, uma coluna de mapa e uma coluna de conjunto (denominada ConjuntoCadeias).

Tabela de origem com coleções

cp_int Lista Mapa ConjuntoCadeias
1 ["1","2","3"] {"S1" : "a", "S2" : "b"} {"a", "b", "c"}
3 ["100","101","102","105"] {"S1" : "t"} {"a","e"}

O conector gera várias tabelas virtuais para representar essa única tabela. A primeira tabela virtual é a tabela base:

Tabela base

cp_int
1
3

A tabela base contém os mesmos dados da tabela de banco de dados original, exceto as coleções, que são omitidas dessa tabela e expandidas em outras tabelas virtuais.

As tabelas a seguir mostram as tabelas virtuais que renormalizam os dados das colunas Lista, Mapa e ConjuntoCadeias:

Lista

cp_int Lista#índice Lista#valor
1 0 1
1 1 2
1 2 3
3 0 100
3 1 101
3 2 102
3 3 105

Mapa

cp_int Mapa#chave Mapa#valor
1 S1 a
1 S2 bi
3 S1 tri

ConjuntoCadeias

cp_int ConjuntoCadeias#valor
1 a
1 bi
1 c
3 a
3 e

As colunas de chave estrangeira nas tabelas virtuais fazem referência às colunas de chave primária na tabela real e indicam a correspondência entre a linha da tabela virtual e a linha da tabela real. As colunas com nomes terminados em #índice ou #chave indicam a posição dos dados dentro da lista ou mapa original. As colunas com nomes terminados em #valor contêm os dados expandidos da coleção.

Ajuda do Analytics 14.1