Conexão ao Cloudera Impala

Esta versão do conector de dados do Cloudera Impala será descontinuada após o Analytics 17.x.
Faça o teste e mude para a nova versão do conector agora para manter a conexão ao Impala no Analytics 18. (Lançamento provisório no segundo semestre de 2024)
Ver Mudança para uma nova versão do conector do ACL

Concept Information

Comando ACCESSDATA

O Cloudera Impala é um serviço de dados na nuvem. Você pode usar o conector de dados do Cloudera Impala para importar dados da sua organização residentes no Impala.

Nota

O Analytics oferece o Impala como um conector opcional. Se esse conector não estiver disponível na janela Acesso a dados, é provável que o coletor não tenha sido selecionado durante a instalação. Para obter mais informações, consulte Instale opcionalmente os conectores de dados do Analytics e o mecanismo do Python.

Antes de começar

Para conectar-se ao Impala, você deve obter:

  • o nome do usuário
  • senha
  • Acesso de leitura

Para obter ajuda na coleta dos pré-requisitos de conexão, entre em contato com o administrador do Impala na sua organização. Se o administrador não conseguir ajudá-lo, você ou o administrador deve entrar em contato com o suporte da Impala.

Criar uma conexão ao Impala

  1. No menu principal do Analytics, selecione Importar > Banco de dados e aplicativo.
  2. Na guia novas conexões, na seção Conectores do ACL, selecione Impala.

    Dica

    Você pode filtrar a lista de conectores disponíveis inserindo uma cadeia de pesquisa na caixa Filtrar conexões. Os conectores são listados em ordem alfabética.

  3. No painel Configurações de Conexão de Dados, insira as configurações da conexão e clique em Salvar e conectar na parte inferior do painel.

    Você pode aceitar o Nome de conexão padrão ou inserir um novo nome.

A conexão do Impala é salva na guia Conexões existentes. No futuro, você poderá reconectar o Impala usando a conexão salva.

Após estabelecer a conexão, a janela Acesso a Dados abre na Área de preparação e você pode começar a importar dados. Para obter ajuda na importação de dados do Impala, consulte Trabalho com a Janela de Acesso a Dados.

Configurações de conexão

Configurações básicas

Configuração Descrição Exemplo
Host

O endereço IP ou nome de host do servidor do Impala.

 
Porta A porta para a conexão à instância do servidor do Impala.  
Banco de dados O nome do banco de dados do Impala a ser usado por padrão.  
Mecanismo de autenticação

O mecanismo de autenticação a ser usado. As opções disponíveis são:

  • Sem autenticação
  • Kerberos
  • Nome do usuário SASL
  • Nome do usuário e senha
Sem autenticação
Realm O realm do host do Impala.  
FQDN do host O nome de domínio totalmente qualificado para o host do Impala. _HOST
Nome do serviço O nome principal do serviço do Kerberos do servidor do Impala. Impala
Nome do usuário O nome do usuário para acessar o servidor do Impala.  
Senha A senha para autenticar o acesso ao servidor do Impala.  
Tamanho do buffer de transporte O número de bytes a ser reservado na memória para armazenar em buffer dados não criptografados da rede. 1000
Usar Simple Authentication and Security Layer (SASL) Especifica se o driver usa SASL para processar a autenticação.  
UID de delegação Quando um ID de usuário é especificado nessa opção, o driver do Impala delega todas as operações realizadas nele ao usuário especificado em vez de ao usuário autenticado da conexão.  

Configurações avançadas

Configuração Descrição Exemplo
Ativar SSL

Especifica se o cliente usa uma conexão criptografada de SSL para comunicação com o servidor do Impala.

 
Permitir discrepância de nome do host de nome comum Especifica se um nome de certificado SSL emitido por uma CA deve corresponder ao nome do host do servidor do Impala.  
Permitir certificado autoassinado de servidor Especifica se o driver permite uma conexão ao servidor do Impala que usa um certificado autoassinado.  
Certificados confiáveis O caminho completo para o arquivo .pem que contém os certificados de CA confiáveis para verificação do servidor ao usar SSL.  
Usar consulta nativa Especifica se o driver usa consultas nativas do Impala SQL. Se essa opção não for selecionada, o driver converterá as consultas emitidas por um aplicativo em uma forma equivalente no Impala SQL. Se o aplicativo estiver preparado para o Impala e já emite Impala SQL, ative esta opção para evitar a sobrecarga extra da transformação de consultas.  
Ativar transações simuladas Especifica se o driver deve simular transações. Se desativado, o driver retorna um erro se tentar executar uma consulta que contém instruções de transação.  
Usar tipos SQL Unicode Especifica os tipos de SQL a serem retornados para tipos de dados cadeia. Quando habilitado, o driver retorna SQL_WVARCHAR para colunas STRING e VARCHAR e retorna SQL_WCHAR para colunas CHAR.  
Linhas recuperadas por bloco O número máximo de linhas que uma consulta retorna por vez. 10000
Tempo limite de socket

Número de segundos que o soquete TCP aguarda uma resposta do servidor antes de esgotar o tempo limite da solicitação e retornar uma mensagem de erro.

Quando essa opção está definida como 0, o soquete TCP não esgota o tempo limite de nenhuma solicitação.

30
Comprimento da coluna de cadeia O número máximo de caracteres que pode estar contido em colunas STRING. 32767

Atualizações de conector de dados

Quando atualiza o Analytics ou o Agente do Robôs, você deve testar todos os scripts que importam dados usando um dos conectores de dados do Analytics (comando ACCESSDATA).

É possível que alterações feitas por fornecedores externos de fontes de dados ou drivers ODBC exigiram atualizações em um ou mais conectores de dados. Pode ser necessário atualizar as conexões de dados com script para que continuem a funcionar corretamente.

  • Execute novamente a importação A maneira mais fácil de atualizar uma conexão é executar manualmente uma importação usando a janela Acesso a Dados na versão atualizada do Analytics. Copie o comando ACCESSDATA do log e use-o para atualizar o script.

    Nota

    Antes de se conectar a uma fonte de dados e executar novamente a importação, limpe o cache do conector para remover o conjunto existente de nomes de tabelas.

    Na guia Conexões existentes na janela Acesso a Dados, ao lado do nome do conector, selecione > Limpar cache.

  • Atualize as especificações de campos Também pode ser necessário atualizar as especificações de campos no corpo do script para compatibilizá-lo com as alterações do esquema da tabela na fonte de dados ou no driver ODBC. As possíveis alterações incluem nomes de campos, tipos de dados de campos e comprimentos de campos e registro.
  • Verifique os resultados de todas as filtragens Você também deve verificar os resultados de qualquer filtragem aplicada durante a importação de dados. Confirme se a filtragem de importação está incluindo e excluindo corretamente os registros.