Se connecter à Apache Hive
Essayez la nouvelle version du connecteur et faites la transition dès maintenant pour pouvoir continuer de vous connecter à Apache Hive dans Analytics 18. (Publication prévue à l'automne 2024)
Voir Passer à une nouvelle version des connecteurs ACL
Concept Information
Apache Hive est un service de données Cloud. Vous pouvez utiliser le connecteur de données d'Apache Hive afin d'importer les données Hive de votre organisation.
Remarque
Analytics fournit Hive comme connecteur optionnel. S'il n'est pas disponible dans votre fenêtre Accès aux données, il est probable que le connecteur n'ait pas été sélectionné lors de l'installation. Pour plus d'informations, consultez la rubrique Installer des connecteurs de données Analytics et un moteur Python optionnels.
Avant de commencer
Pour vous connecter à Hive, munissez-vous des éléments suivants :
- nom d'utilisateur et mot de passe ;
- le port de connexion qui convient ;
- le schéma d'authentification utilisé ;
- le nom d'hôte du serveur ou l'adresse IP ;
- le mode de transport pour communiquer avec le serveur
- Accès en lecture
Pour obtenir de l'aide concernant la réunion des conditions préalables à la connexion, contactez l'administrateur Hive de votre organisation. Si votre administrateur ne peut pas vous aider, vous ou votre administrateur devez contacter le support Hive.
Créer une connexion Hive
- Dans le menu principal Analytics, sélectionnez Importer > Base de données et application.Analytics
- Depuis l'onglet Nouvelles connexions, sous la section Connecteurs ACL, sélectionnez Hive.
Astuce
Vous pouvez filtrer la liste des connecteurs disponibles en indiquant une chaîne de recherche dans la zone Filtrer les connexions. Les connecteurs sont indiqués par ordre alphabétique.
- Dans le panneau Paramètres de connexion aux données entrez les paramètres de connexion, et en bas du panneau, cliquez sur Enregistrer et connecter.
Vous pouvez accepter le nom de connexion proposé par défaut ou en saisir un nouveau.
La connexion correspondant à Hive est enregistrée dans l'onglet Connexions existantes. À l'avenir, vous pourrez vous reconnecter à Hive à partir de la connexion enregistrée.
Une fois la connexion établie, la fenêtre Accès aux données s'ouvre sur la Zone de transit et vous pouvez commencer l'importation des données. Pour obtenir de l'aide concernant l'importation de données à partir de Hive, consultez la rubrique Utilisation de la fenêtre Accès aux données.
Paramètres de connexion
Paramètres de base
Paramètre | Description | Exemple |
---|---|---|
Type de serveur Hive | Spécifie l'instance du serveur Hive à laquelle se connecter. | Serveur Hive 2 |
Mode Découverte de service |
Précise comment les services du serveur Hive sont découverts. Les options disponibles sont :
|
Aucune découverte de service |
Hôte(s) | Adresse IP ou nom d'hôte du serveur Hive. | |
Port | Port pour la connexion à l'instance du serveur Hive. | 10000 |
Base de données | Nom du schéma de la base de données à utiliser lorsqu'un schéma n'est pas explicitement spécifié dans une requête. | |
Espace de noms ZooKeeper | L'espace de noms configuré sur ZooKeeper pour les znodes du serveur Hive. | |
Mécanisme d'authentification |
Indique le mécanisme d'authentification à utiliser. Les options disponibles sont :
|
Aucune authentification |
Domaine | Domaine de l'hôte Hive Server 2. | |
Nom de domaine complet de l'hôte | Nom de domaine complet de l'hôte du serveur Hive. | _HOST |
Nom du service | Nom principal du service Kerberos du serveur Hive. | |
Nom d'utilisateur | Nom d'utilisateur pour s'authentifier auprès du serveur Hive. | |
Mot de passe | Mot de passe pour que le nom d'utilisateur puisse s'authentifier auprès du serveur Hive. | |
UID de délégation | ID de l'utilisateur délégué à qui le pilote doit déléguer toutes les opérations Hive, plutôt qu'à l'utilisateur authentifié pour la connexion. | |
Transport Thrift |
Spécifie le protocole de transport à utiliser dans la couche Thrift. Les options disponibles sont :
|
Binaire |
Paramètres avancés
Paramètre | Description | Exemple |
---|---|---|
Activer SSL | Indique si le client utilise une connexion cryptée SSL pour communiquer avec le serveur Hive. | |
Autoriser l'incompatibilité nom commun-nom d'hôte | Spécifie si le nom d'un certificat SSL émis par l'autorité de certification doit correspondre au nom d'hôte du serveur Hive. | |
Activer un certificat de serveur auto-signé | Indique si le pilote autorise une connexion au serveur Hive qui utilise un certificat auto-signé, même si ce certificat ne figure pas dans la liste des certificats de confiance. | |
Certificats approuvés | Chemin d'accès complet du fichier .pem contenant les certificats des AC de confiance, pour vérifier le serveur lors de l'utilisation du protocole SSL. | |
SSL bidirectionnel | Indique si le protocole SSL bidirectionnel est activé. | |
Fichier de certificat client | Chemin d'accès complet au fichier .pem contenant le certificat SSL du client. | |
Fichier de clé privée client | Chemin d'accès complet au fichier .pem contenant la clé privée SSL du client. | |
Mot de passe de clé privée client | Mot de passe du fichier de clés privées spécifié dans le champ Fichier de clés privées du client. | |
Utiliser une requête native | Spécifie si le pilote utilise des requêtes HiveQL natives. Si cette option n'est pas sélectionnée, le pilote convertit les requêtes émises par une application en une forme équivalente dans HiveQL. | |
SQLPrepare rapide | Spécifie si le pilote reporte l'exécution de la requête à SQLExecute. | |
La configuration du pilote est prioritaire | Spécifie si les paramètres de configuration du pilote ont la priorité sur les paramètres de connexion et de DSN. | |
Utiliser Async Exec | Spécifie s'il faut exécuter les requêtes de manière synchrone ou asynchrone. | |
Intervalle d'interrogation Async Exec | Temps en millisecondes entre chaque sondage pour l'état d'exécution de la requête. | 100 |
Obtenir des tables avec une requête | Indique si le pilote utilise la requête SHOW TABLES pour récupérer les noms des tables dans la base de données. Si elle est désactivée, le pilote utilise l'appel API GetTables Thrift. | |
Types de caractères Unicode SQL | Spécifie les types SQL à renvoyer pour les types de données de type chaîne. Lorsque cela est activé, le pilote renvoie SQL_WVARCHAR pour les colonnes STRING et VARCHAR, et renvoie SQL_WCHAR pour les colonnes CHAR. | |
Afficher la table système | Indique si le pilote renvoie la table hive_system pour les appels de fonctions du catalogue comme les SQLTables et les SQLColumns. | |
Utiliser SSPI uniquement | Spécifie si le pilote gère l'authentification Kerberos avec le plugin SSPI ou avec MIT Kerberos. | |
Récupération automatiquement d'une session non valide | Indique si le pilote ouvre automatiquement une nouvelle session lorsque la session existante n'est plus valide. | |
Nombre de lignes extraites par bloc | Nombre maximum de lignes qu'une requête renvoie à la fois. | 10000 |
Longueur des colonnes des chaînes de caractères par défaut | Nombre maximum de caractères pouvant être contenus dans les colonnes STRING. | 255 |
Longueur des colonnes binaires | Longueur maximale des données pour les colonnes BINARY. | 32767 |
Échelle de la colonne décimale | Nombre maximum de chiffres à droite de la virgule pour les types de données numériques. | 10 |
Délai d'attente du socket | Nombre de secondes pendant lesquelles une opération peut rester inactive avant d'être fermée. | 60 |
Chemin HTTP | URL partielle correspondant au serveur Hive. |
Champs de connexion Hive
Noms uniques des colonnes
Les Hiveconnexions effectuées par le biais de la fenêtre Accès aux données utilisent un paramètre de chaîne de connexion EnableUniqueColumnName défini par défaut sur 0. Ce paramètre doit avoir la valeur 0 pour s'assurer que les bons noms de colonnes sont récupérés au moment de la connexion.
Si vous créez une connexion Hive à l'aide d'un DSN plutôt qu'à partir de la fenêtre Accès aux données, cette valeur est définie sur 1 par défaut. Pour que votre connexion fonctionne, vous devez remplacer cette valeur par 0 dans le registre Windows.
Remarque
Les scripts utilisant les connexions DSN définies dans les versions d'ACL antérieures à 13.1 continuent de fonctionner après la mise à niveau vers la version 13.1.