Conectar ao Apache Cassandra
O Apache Cassandra é um sistema de gerenciamento de banco de dados NoSQL. Use o conector de dados do Analytics para importar dados da sua organização residentes no Cassandra.
Antes de começar
Para conectar-se ao Cassandra, você deve obter:
- o nome do host do servidor de banco de dados
- a porta de conexão correta
- nome do usuário e senha, se usar autenticação
Para obter ajuda na coleta dos pré-requisitos de conexão, entre em contato com o administrador de conectores da sua organização. Se o administrador não conseguir ajudá-lo, você ou o administrador deve entrar em contato com o suporte do conector.
Criar uma conexão ao Cassandra
- No menu principal do Analytics, selecione Importar > Banco de dados e aplicativo.
- Na guia Novas conexões, na seção Conectores do ACL, selecione seu conector Cassandra.
Dica
Você pode filtrar a lista de conectores disponíveis inserindo uma cadeia de pesquisa na caixa Filtrar conexões. Os conectores são listados em ordem alfabética.
- No painel Configurações de Conexão de Dados, insira as configurações da conexão e clique em Salvar e conectar na parte inferior do painel.
Você pode aceitar o Nome de conexão padrão ou inserir um novo nome.
A conexão do conector é salva na guia Conexões existentes. No futuro, você poderá reconectar esse conector usando a conexão salva.
Após estabelecer a conexão, a janela Acesso a Dados abre na Área de preparação e você pode começar a importar dados. Para obter ajuda na importação de dados do conector, consulte Importar dados usando a janela de Acesso a Dados.
Consultar o Cassandra
Uma vantagem do projeto do Apache Cassandra é a capacidade de armazenar dados desnormalizados em um número menor de tabelas. É possível simplificar as transações aproveitando estruturas de dados aninhados, como conjuntos, listas e mapas. No entanto, o Analytics não permite o acesso a esse tipo de dados. Com a renormalização dos dados contidos em coleções (conjuntos, listas e mapas) em tabelas virtuais, o conector permite que os usuários interajam diretamente com os dados, com o Cassandra se encarregando do armazenamento desses dados na forma desnormalizada.
Se uma tabela contiver colunas de coleções, na primeira consulta da tabela, o conector criará as seguintes tabelas virtuais:
- Uma tabela "base", que contém os mesmos dados da tabela real, exceto pelas colunas de coleções.
- Uma tabela virtual para cada coluna de coleção, que expande os dados aninhados.
As tabelas virtuais fazem referência aos dados na tabela real, permitindo que o conector acesse os dados desnormalizados. Ao consultar as tabelas virtuais, você pode acessar o conteúdo das coleções do Cassandra usando ODBC.
A tabela base e as tabelas virtuais aparecem como tabelas adicionais na lista de tabelas existentes no banco de dados. A tabela base usa o mesmo nome da tabela real que representa. As tabelas virtuais que representam coleções são nomeadas usando o nome da tabela real, um separador (por padrão, _vt_) e o nome da coluna.
Exemplo
A TabelaExemplo é uma tabela do banco de dados Cassandra que contém uma coluna de chave primária do tipo inteiro denominada cp_int, uma coluna de lista, uma coluna de mapa e uma coluna de conjunto (denominada ConjuntoCadeias).
Tabela de origem com coleções
| cp_int | Lista | Mapa | ConjuntoCadeias |
|---|---|---|---|
| 1 | ["1","2","3"] | {"S1" : "a", "S2" : "b"} | {"a", "b", "c"} |
| 3 | ["100","101","102","105"] | {"S1" : "t"} | {"a","e"} |
O conector gera várias tabelas virtuais para representar essa única tabela. A primeira tabela virtual é a tabela base:
Tabela base
| cp_int |
|---|
| 1 |
| 3 |
A tabela base contém os mesmos dados da tabela de banco de dados original, exceto as coleções, que são omitidas dessa tabela e expandidas em outras tabelas virtuais.
As tabelas a seguir mostram as tabelas virtuais que renormalizam os dados das colunas Lista, Mapa e ConjuntoCadeias:
Lista
| cp_int | Lista#índice | Lista#valor |
|---|---|---|
| 1 | 0 | 1 |
| 1 | 1 | 2 |
| 1 | 2 | 3 |
| 3 | 0 | 100 |
| 3 | 1 | 101 |
| 3 | 2 | 102 |
| 3 | 3 | 105 |
Mapa
| cp_int | Mapa#chave | Mapa#valor |
|---|---|---|
| 1 | S1 | a |
| 1 | S2 | bi |
| 3 | S1 | tri |
ConjuntoCadeias
| cp_int | ConjuntoCadeias#valor |
|---|---|
| 1 | a |
| 1 | bi |
| 1 | c |
| 3 | a |
| 3 | e |
As colunas de chave estrangeira nas tabelas virtuais fazem referência às colunas de chave primária na tabela real e indicam a correspondência entre a linha da tabela virtual e a linha da tabela real. As colunas com nomes terminados em #índice ou #chave indicam a posição dos dados dentro da lista ou mapa original. As colunas com nomes terminados em #valor contêm os dados expandidos da coleção.