Conexión a Cloudera Impala (v.1)
Los scripts que utilicen esta versión del conector Impala no funcionarán en Analytics 18.x y deberán actualizarse para utilizar la nueva versión del conector.
Esta versión del conector seguirá funcionando en Analytics 17.x, y versiones anteriores de Analytics, mientras el conector y la fuente de datos sigan siendo compatibles.
Véase Transición a una nueva versión del conector de ACL
Información de concepto
Cloudera Impala es un servicio de datos en la nube. Puede utilizar el conector de datos de Cloudera Impala para importar los datos de Impala de su organización.
Antes de comenzar
Para conectarse a Cloudera, debe contar con lo siguiente:
- nombre de usuario
- contraseña
- Acceso de lectura
Si desea obtener ayuda para reunir los requisitos previos para la conexión, comuníquese con el administrador de Impala de su organización. Si el administrador no puede ayudarlo, usted o el administrador deben comunicarse con el Soporte de Impala.
Crear una conexión de Impala
- Desde el menú principal de Analytics, seleccione Importar > Base de datos y aplicación.Analytics
- Desde la ficha Nuevas conexiones, en la sección Conectores ACL, seleccione Impala.
Consejo
Puede filtrar la lista de conectores disponibles introduciendo una cadena de búsqueda en el cuadro Filtrar conexiones. Los conectores se indican en orden alfabético.
- En el panel Ajustes de conexión de datos, ingrese la configuración de la conexión y, en la parte inferior del panel, haga clic en Guardar y conectar.
Puede aceptar el Nombre de la conexión predeterminado o introducir uno nuevo.
La conexión de Impala se guarda en la ficha Conexiones existentes. En el futuro, puede volver a conectarse a Impala desde la conexión guardada.
Una vez que se establezca la conexión, se abre la ventana Acceso a Datos en el Área de almacenamiento temporal y puede comenzar a importar datos. Si desea obtener ayuda para importar datos desde Impala, consulte Trabajo con la ventana Acceso a Datos.
Ajustes de conexión
Ajustes básicos
Ajuste | Descripción | Ejemplo |
---|---|---|
Host |
La dirección IP o el nombre de host del servidor de Impala. |
|
Puerto | El puerto para la conexión a la instancia del servidor de Impala. | |
Base de datos | El nombre de la base de datos de Impala que se debe usar por valor predeterminado. | |
Mecanismo de autenticación |
El mecanismo de autenticación que se debe utilizar. Las opciones disponibles son las siguientes:
|
Sin autenticación |
Dominio | El dominio del host de Impala. | |
FQDN del host | El nombre de dominio totalmente calificado del host de Impala. | _HOST |
Nombre de servicio | El nombre principal del servicio de Kerberos del servidor de Impala. | impala |
Nombre de usuario | El nombre de usuario para acceder al servidor de Impala. | |
Contraseña | La contraseña para autenticar el acceso al servidor de Impala. | |
Tamaño de la memoria intermedia de transporte | La cantidad de bytes que se deben reservar en la memoria para el almacenamiento intermedio de datos encriptados de la red. | 1000 |
Utilizar SASL (Capa de seguridad y autenticación simple) | Especifica si el controlador utiliza SASL para manejar la autenticación. | |
UID para la delegación | Cuando se especifica un ID de usuario para esta opción, el controlador de Impala delega todas las operaciones de Impala al usuario especificado, en lugar de delegarlas al usuario autenticado para la conexión. |
Ajustes avanzados
Ajuste | Descripción | Ejemplo |
---|---|---|
Permitir SSL |
Especifica si el cliente utiliza una conexión cifrada con SSL para comunicarse con el servidor de Impala. |
|
Permitir la falta de concordancia del nombre de host con el nombre común | Especifica si el nombre del certificado SSL emitido por una autoridad de certificación debe coincidir con el nombre de host del servidor de Impala. | |
Permitir el certificado de servidor autofirmado | Especifica si el controlador permite una conexión a un servidor de Impala que utiliza un certificado autofirmado. | |
Certificados de confianza | La ruta completa al archivo .pem que contiene los certificados de confianza firmados por una autoridad de certificación para verificar al usuario al usar SSL. | |
Utilizar consulta nativa | Especifica si el controlador usa consultas Impala SQL nativas. Si no se selecciona esta opción, el controlador convierte las consultas emitidas por una aplicación en una forma equivalente en Impala SQL. Si la aplicación está preparada para Impala y ya emite Impala SQL, habilite esta opción para evitar el trabajo adicional de transformar las consultas. | |
Permitir transacciones simuladas | Especifica si el controlador debe simular las transacciones. Cuando esta opción está desactivada, el controlador devuelve un error si intenta ejecutar una consulta que contiene instrucciones de transacción. | |
Utilizar tipos de Unicode de SQL | Especifica los tipos de SQL que se deben devolver para los tipos de datos de cadena. Cuando está activado, el controlador devuelve SQL_WVARCHAR para columnas VARCHAR y STRING, y devuelve SQL_WCHAR para columnas CHAR. | |
Filas recuperadas por bloque | La cantidad máxima de filas que devuelve una consulta al mismo tiempo. | 10000 |
Tiempo de espera de socket (s) |
La cantidad de segundos que un socket de TCP espera una respuesta del servidor antes de agotar el tiempo de espera de la solicitud y devolver un mensaje de error. Cuando se ajusta en 0, el socket de TCP no agota el tiempo de espera de ninguna solicitud. |
30 |
Longitud de columna de cadena | La cantidad máxima de caracteres que pueden incluirse en las columnas STRING. | 32767 |
Actualizaciones del conector de datos
Cuando actualiza Analytics o el Agente de Robots, debe comprobar los scripts que importan datos con uno de los conectores de datos de Analytics (comando ACCESSDATA).
Es posible que los cambios realizados por los proveedores de controladores ODBC o los orígenes de datos de terceros requieran la actualización de uno o más conectores de datos. Tal vez sea necesario actualizar las conexiones de datos en los scripts para continuar trabajando correctamente.
- Volver a ejecutar la importación La manera más sencilla de actualizar una conexión consiste en realizar una importación manualmente con la ventana Acceso a Datos en la versión actualizada de Analytics. Copie el comando ACCESSDATA desde el log y utilícelo para actualizar su script.
Nota
Antes de conectarse al origen de los datos y volver a ejecutar la importación, borre la caché del conector para limpiar los nombres del conjunto de tablas existentes.
En la ficha Conexiones existentes de la ventana Acceso a Datos, junto al nombre del conector, seleccione
> Borrar caché.
- Actualice las especificaciones del campo Es posible que también deba actualizar las especificaciones del campo en el cuerpo del script para alinearas con los cambios en el esquema de la tabla dentro del origen de datos o el controlador ODBC. Algunos cambios posibles son los nombres de campos, los tipos de datos de los campos y la longitud de los campos y los registros.
- Compruebe los resultados de los filtros También debe comprobar los resultados de los filtros que aplique como parte de la importación de datos. Confirme que el filtrado de la importación incluye y excluye correctamente los registros.