Se connecter à Apache Hive

Cette version du connecteur de données Apache Hive ne sera plus disponible après Analytics 17.x.
Essayez la nouvelle version du connecteur et faites la transition dès maintenant pour pouvoir continuer de vous connecter à Apache Hive dans Analytics 18. (Publication prévue à l'automne 2024)
Voir Passer à une nouvelle version des connecteurs ACL

Concept Information

Commande ACCESSDATA

Apache Hive est un service de données Cloud. Vous pouvez utiliser le connecteur de données d'Apache Hive afin d'importer les données Hive de votre organisation.

Remarque

Analytics fournit Hive comme connecteur optionnel. S'il n'est pas disponible dans votre fenêtre Accès aux données, il est probable que le connecteur n'ait pas été sélectionné lors de l'installation. Pour plus d'informations, consultez la rubrique Installer des connecteurs de données Analytics et un moteur Python optionnels.

Avant de commencer

Pour vous connecter à Hive, munissez-vous des éléments suivants :

  • nom d'utilisateur et mot de passe ;
  • le port de connexion qui convient ;
  • le schéma d'authentification utilisé ;
  • le nom d'hôte du serveur ou l'adresse IP ;
  • le mode de transport pour communiquer avec le serveur
  • Accès en lecture

Pour obtenir de l'aide concernant la réunion des conditions préalables à la connexion, contactez l'administrateur Hive de votre organisation. Si votre administrateur ne peut pas vous aider, vous ou votre administrateur devez contacter le support Hive.

Créer une connexion Hive

  1. Dans le menu principal Analytics, sélectionnez Importer > Base de données et application.Analytics
  2. Depuis l'onglet Nouvelles connexions, sous la section Connecteurs ACL, sélectionnez Hive.

    Astuce

    Vous pouvez filtrer la liste des connecteurs disponibles en indiquant une chaîne de recherche dans la zone Filtrer les connexions. Les connecteurs sont indiqués par ordre alphabétique.

  3. Dans le panneau Paramètres de connexion aux données entrez les paramètres de connexion, et en bas du panneau, cliquez sur Enregistrer et connecter.

    Vous pouvez accepter le nom de connexion proposé par défaut ou en saisir un nouveau.

La connexion correspondant à Hive est enregistrée dans l'onglet Connexions existantes. À l'avenir, vous pourrez vous reconnecter à Hive à partir de la connexion enregistrée.

Une fois la connexion établie, la fenêtre Accès aux données s'ouvre sur la Zone de transit et vous pouvez commencer l'importation des données. Pour obtenir de l'aide concernant l'importation de données à partir de Hive, consultez la rubrique Utilisation de la fenêtre Accès aux données.

Paramètres de connexion

Paramètres de base

Paramètre Description Exemple
Type de serveur Hive Spécifie l'instance du serveur Hive à laquelle se connecter. Serveur Hive 2
Mode Découverte de service

Précise comment les services du serveur Hive sont découverts. Les options disponibles sont :

  • Aucune découverte de service : le pilote se connecte à Hive sans utiliser de service de découverte.
  • ZooKeeper : le pilote découvre les services du serveur Hive grâce au service ZooKeeper.
Aucune découverte de service
Hôte(s) Adresse IP ou nom d'hôte du serveur Hive.  
Port Port pour la connexion à l'instance du serveur Hive. 10000
Base de données Nom du schéma de la base de données à utiliser lorsqu'un schéma n'est pas explicitement spécifié dans une requête.  
Espace de noms ZooKeeper L'espace de noms configuré sur ZooKeeper pour les znodes du serveur Hive.  
Mécanisme d'authentification

Indique le mécanisme d'authentification à utiliser. Les options disponibles sont :

  • Aucune authentification
  • Kerberos
  • Nom d'utilisateur
  • Nom d'utilisateur et mot de passe
  • Service Windows Azure HDInsight
Aucune authentification
Domaine Domaine de l'hôte Hive Server 2.  
Nom de domaine complet de l'hôte Nom de domaine complet de l'hôte du serveur Hive. _HOST
Nom du service Nom principal du service Kerberos du serveur Hive.  
Nom d'utilisateur Nom d'utilisateur pour s'authentifier auprès du serveur Hive.  
Mot de passe Mot de passe pour que le nom d'utilisateur puisse s'authentifier auprès du serveur Hive.  
UID de délégation ID de l'utilisateur délégué à qui le pilote doit déléguer toutes les opérations Hive, plutôt qu'à l'utilisateur authentifié pour la connexion.  
Transport Thrift

Spécifie le protocole de transport à utiliser dans la couche Thrift. Les options disponibles sont :

  • Binaire
  • SASL
  • HTTP
Binaire

Paramètres avancés

Paramètre Description Exemple
Activer SSL Indique si le client utilise une connexion cryptée SSL pour communiquer avec le serveur Hive.  
Autoriser l'incompatibilité nom commun-nom d'hôte Spécifie si le nom d'un certificat SSL émis par l'autorité de certification doit correspondre au nom d'hôte du serveur Hive.  
Activer un certificat de serveur auto-signé Indique si le pilote autorise une connexion au serveur Hive qui utilise un certificat auto-signé, même si ce certificat ne figure pas dans la liste des certificats de confiance.  
Certificats approuvés Chemin d'accès complet du fichier .pem contenant les certificats des AC de confiance, pour vérifier le serveur lors de l'utilisation du protocole SSL.  
SSL bidirectionnel Indique si le protocole SSL bidirectionnel est activé.  
Fichier de certificat client Chemin d'accès complet au fichier .pem contenant le certificat SSL du client.  
Fichier de clé privée client Chemin d'accès complet au fichier .pem contenant la clé privée SSL du client.  
Mot de passe de clé privée client Mot de passe du fichier de clés privées spécifié dans le champ Fichier de clés privées du client.  
Utiliser une requête native Spécifie si le pilote utilise des requêtes HiveQL natives. Si cette option n'est pas sélectionnée, le pilote convertit les requêtes émises par une application en une forme équivalente dans HiveQL.  
SQLPrepare rapide Spécifie si le pilote reporte l'exécution de la requête à SQLExecute.  
La configuration du pilote est prioritaire Spécifie si les paramètres de configuration du pilote ont la priorité sur les paramètres de connexion et de DSN.  
Utiliser Async Exec Spécifie s'il faut exécuter les requêtes de manière synchrone ou asynchrone.  
Intervalle d'interrogation Async Exec Temps en millisecondes entre chaque sondage pour l'état d'exécution de la requête. 100
Obtenir des tables avec une requête Indique si le pilote utilise la requête SHOW TABLES pour récupérer les noms des tables dans la base de données. Si elle est désactivée, le pilote utilise l'appel API GetTables Thrift.  
Types de caractères Unicode SQL Spécifie les types SQL à renvoyer pour les types de données de type chaîne. Lorsque cela est activé, le pilote renvoie SQL_WVARCHAR pour les colonnes STRING et VARCHAR, et renvoie SQL_WCHAR pour les colonnes CHAR.  
Afficher la table système Indique si le pilote renvoie la table hive_system pour les appels de fonctions du catalogue comme les SQLTables et les SQLColumns.  
Utiliser SSPI uniquement Spécifie si le pilote gère l'authentification Kerberos avec le plugin SSPI ou avec MIT Kerberos.  
Récupération automatiquement d'une session non valide Indique si le pilote ouvre automatiquement une nouvelle session lorsque la session existante n'est plus valide.  
Nombre de lignes extraites par bloc Nombre maximum de lignes qu'une requête renvoie à la fois. 10000
Longueur des colonnes des chaînes de caractères par défaut Nombre maximum de caractères pouvant être contenus dans les colonnes STRING. 255
Longueur des colonnes binaires Longueur maximale des données pour les colonnes BINARY. 32767
Échelle de la colonne décimale Nombre maximum de chiffres à droite de la virgule pour les types de données numériques. 10
Délai d'attente du socket Nombre de secondes pendant lesquelles une opération peut rester inactive avant d'être fermée. 60
Chemin HTTP URL partielle correspondant au serveur Hive.  

Champs de connexion Hive

Noms uniques des colonnes

Les Hiveconnexions effectuées par le biais de la fenêtre Accès aux données utilisent un paramètre de chaîne de connexion EnableUniqueColumnName défini par défaut sur 0. Ce paramètre doit avoir la valeur 0 pour s'assurer que les bons noms de colonnes sont récupérés au moment de la connexion.

Si vous créez une connexion Hive à l'aide d'un DSN plutôt qu'à partir de la fenêtre Accès aux données, cette valeur est définie sur 1 par défaut. Pour que votre connexion fonctionne, vous devez remplacer cette valeur par 0 dans le registre Windows.

Remarque

Les scripts utilisant les connexions DSN définies dans les versions d'ACL antérieures à 13.1 continuent de fonctionner après la mise à niveau vers la version 13.1.