Conexión a Cloudera Impala (v.1)

Esta versión del conector de datos de Cloudera Impala se ha eliminado de Analytics 18.x.
Los scripts que utilicen esta versión del conector Impala no funcionarán en Analytics 18.x y deberán actualizarse para utilizar la nueva versión del conector.
Esta versión del conector seguirá funcionando en Analytics 17.x, y versiones anteriores de Analytics, mientras el conector y la fuente de datos sigan siendo compatibles.
Véase Transición a una nueva versión del conector de ACL

Información de concepto

Comando ACCESSDATA

Cloudera Impala es un servicio de datos en la nube. Puede utilizar el conector de datos de Cloudera Impala para importar los datos de Impala de su organización.

Antes de comenzar

Para conectarse a Cloudera, debe contar con lo siguiente:

  • nombre de usuario
  • contraseña
  • Acceso de lectura

Si desea obtener ayuda para reunir los requisitos previos para la conexión, comuníquese con el administrador de Impala de su organización. Si el administrador no puede ayudarlo, usted o el administrador deben comunicarse con el Soporte de Impala.

Crear una conexión de Impala

  1. Desde el menú principal de Analytics, seleccione Importar > Base de datos y aplicación.Analytics
  2. Desde la ficha Nuevas conexiones, en la sección Conectores ACL, seleccione Impala.

    Consejo

    Puede filtrar la lista de conectores disponibles introduciendo una cadena de búsqueda en el cuadro Filtrar conexiones. Los conectores se indican en orden alfabético.

  3. En el panel Ajustes de conexión de datos, ingrese la configuración de la conexión y, en la parte inferior del panel, haga clic en Guardar y conectar.

    Puede aceptar el Nombre de la conexión predeterminado o introducir uno nuevo.

La conexión de Impala se guarda en la ficha Conexiones existentes. En el futuro, puede volver a conectarse a Impala desde la conexión guardada.

Una vez que se establezca la conexión, se abre la ventana Acceso a Datos en el Área de almacenamiento temporal y puede comenzar a importar datos. Si desea obtener ayuda para importar datos desde Impala, consulte Trabajo con la ventana Acceso a Datos.

Ajustes de conexión

Ajustes básicos

Ajuste Descripción Ejemplo
Host

La dirección IP o el nombre de host del servidor de Impala.

 
Puerto El puerto para la conexión a la instancia del servidor de Impala.  
Base de datos El nombre de la base de datos de Impala que se debe usar por valor predeterminado.  
Mecanismo de autenticación

El mecanismo de autenticación que se debe utilizar. Las opciones disponibles son las siguientes:

  • Sin autenticación
  • Kerberos
  • Nombre de usuario SASL
  • Nombre de usuario y contraseña
Sin autenticación
Dominio El dominio del host de Impala.  
FQDN del host El nombre de dominio totalmente calificado del host de Impala. _HOST
Nombre de servicio El nombre principal del servicio de Kerberos del servidor de Impala. impala
Nombre de usuario El nombre de usuario para acceder al servidor de Impala.  
Contraseña La contraseña para autenticar el acceso al servidor de Impala.  
Tamaño de la memoria intermedia de transporte La cantidad de bytes que se deben reservar en la memoria para el almacenamiento intermedio de datos encriptados de la red. 1000
Utilizar SASL (Capa de seguridad y autenticación simple) Especifica si el controlador utiliza SASL para manejar la autenticación.  
UID para la delegación Cuando se especifica un ID de usuario para esta opción, el controlador de Impala delega todas las operaciones de Impala al usuario especificado, en lugar de delegarlas al usuario autenticado para la conexión.  

Ajustes avanzados

Ajuste Descripción Ejemplo
Permitir SSL

Especifica si el cliente utiliza una conexión cifrada con SSL para comunicarse con el servidor de Impala.

 
Permitir la falta de concordancia del nombre de host con el nombre común Especifica si el nombre del certificado SSL emitido por una autoridad de certificación debe coincidir con el nombre de host del servidor de Impala.  
Permitir el certificado de servidor autofirmado Especifica si el controlador permite una conexión a un servidor de Impala que utiliza un certificado autofirmado.  
Certificados de confianza La ruta completa al archivo .pem que contiene los certificados de confianza firmados por una autoridad de certificación para verificar al usuario al usar SSL.  
Utilizar consulta nativa Especifica si el controlador usa consultas Impala SQL nativas. Si no se selecciona esta opción, el controlador convierte las consultas emitidas por una aplicación en una forma equivalente en Impala SQL. Si la aplicación está preparada para Impala y ya emite Impala SQL, habilite esta opción para evitar el trabajo adicional de transformar las consultas.  
Permitir transacciones simuladas Especifica si el controlador debe simular las transacciones. Cuando esta opción está desactivada, el controlador devuelve un error si intenta ejecutar una consulta que contiene instrucciones de transacción.  
Utilizar tipos de Unicode de SQL Especifica los tipos de SQL que se deben devolver para los tipos de datos de cadena. Cuando está activado, el controlador devuelve SQL_WVARCHAR para columnas VARCHAR y STRING, y devuelve SQL_WCHAR para columnas CHAR.  
Filas recuperadas por bloque La cantidad máxima de filas que devuelve una consulta al mismo tiempo. 10000
Tiempo de espera de socket (s)

La cantidad de segundos que un socket de TCP espera una respuesta del servidor antes de agotar el tiempo de espera de la solicitud y devolver un mensaje de error.

Cuando se ajusta en 0, el socket de TCP no agota el tiempo de espera de ninguna solicitud.

30
Longitud de columna de cadena La cantidad máxima de caracteres que pueden incluirse en las columnas STRING. 32767

Actualizaciones del conector de datos

Cuando actualiza Analytics o el Agente de Robots, debe comprobar los scripts que importan datos con uno de los conectores de datos de Analytics (comando ACCESSDATA).

Es posible que los cambios realizados por los proveedores de controladores ODBC o los orígenes de datos de terceros requieran la actualización de uno o más conectores de datos. Tal vez sea necesario actualizar las conexiones de datos en los scripts para continuar trabajando correctamente.

  • Volver a ejecutar la importación La manera más sencilla de actualizar una conexión consiste en realizar una importación manualmente con la ventana Acceso a Datos en la versión actualizada de Analytics. Copie el comando ACCESSDATA desde el log y utilícelo para actualizar su script.

    Nota

    Antes de conectarse al origen de los datos y volver a ejecutar la importación, borre la caché del conector para limpiar los nombres del conjunto de tablas existentes.

    En la ficha Conexiones existentes de la ventana Acceso a Datos, junto al nombre del conector, seleccione > Borrar caché.

  • Actualice las especificaciones del campo Es posible que también deba actualizar las especificaciones del campo en el cuerpo del script para alinearas con los cambios en el esquema de la tabla dentro del origen de datos o el controlador ODBC. Algunos cambios posibles son los nombres de campos, los tipos de datos de los campos y la longitud de los campos y los registros.
  • Compruebe los resultados de los filtros También debe comprobar los resultados de los filtros que aplique como parte de la importación de datos. Confirme que el filtrado de la importación incluye y excluye correctamente los registros.