Mit Cloudera Impala verbinden

Konzept-Informationen

ACCESSDATA-Befehl

Cloudera Impala ist ein Cloud-Datendienst. Sie können den Cloudera-Impala-Datenkonnektor verwenden, um die in Impala gespeicherten Daten Ihrer Organisation zu importieren.

Hinweis

Analytics bietet Impala als optionalen Konnektor an. Falls er in Ihrem Fenster „Datenzugriff“ nicht verfügbar ist, wurde er während der Installation wahrscheinlich nicht ausgewählt. Weitere Informationen finden Sie unter Optionale Analytics-Datenkonnektoren und Python Engine installieren.

Vorbereitungen

Für eine Verbindung mit Impala müssen Sie die folgenden Informationen einholen:

  • Benutzername
  • Kennwort
  • Lesezugriff

Hilfe für die Zusammenstellung der Verbindungsvoraussetzungen erhalten Sie vom Impala-Administrator Ihrer Organisation. Falls Ihr Administrator Ihnen nicht weiterhelfen kann, sollten Sie oder Ihr Administrator den Impala-Support kontaktieren.

Eine Impala-Verbindung erstellen

  1. Wählen Sie aus dem Analytics-Hauptmenü Importieren > Datenbank und Anwendung.
  2. Auf der Registerkarte Neue Verbindungen im Abschnitt ACL-Konnektoren wählen Sie Impala.

    Tipp

    Sie können die Liste verfügbarer Konnektoren filtern, indem Sie in das Feld Verbindungen filtern eine Suchzeichenfolge eingeben. Die Konnektoren sind alphabetisch aufgelistet.

  3. Im Bereich Datenverbindungseinstellungen rufen Sie die Verbindungseinstellungen auf und klicken unten innerhalb des Bereichs auf Speichern und verbinden.

    Sie können den standardmäßigen Verbindungsnamen akzeptieren oder einen neuen Namen eingeben.

Die Verbindung für Impala wird in der Registerkarte Bestehende Verbindungen gespeichert. In Zukunft können Sie sich über die gespeicherte Verbindung erneut mit Impala verbinden.

Sobald die Verbindung hergestellt ist, wird das Fenster „Datenzugriff“ im Stagingbereich geöffnet und Sie können den Datenimport beginnen. Hilfe für den Datenimport aus Impala finden Sie unter Mit dem Fenster „Datenzugriff“ arbeiten.

Verbindungseinstellungen

Grundlegende Einstellungen

Einstellung Beschreibung Beispiel
Host

Die IP-Adresse oder der Hostname des Impala-Servers.

 
Port Der Port für die Verbindung mit der Impala-Serverinstanz.  
Datenbank Name der standardmäßig zu verwendenden Impala-Datenbank.  
Authentifizierungsmechanismus

Der zu verwendende Authentifizierungsmechanismus. Verfügbare Optionen sind:

  • Keine Authentifizierung
  • Kerberos
  • SASL-Benutzername
  • Benutzername und Kennwort
Keine Authentifizierung
Bereich Bereich des Impala-Hosts.  
Host-FQDN Vollqualifizierter Domänenname des Impala-Hosts. _HOST
Dienstname Der Kerberos-Dienstprinzipalname des Impala-Servers. Impala
Benutzername Der Benutzername für den Zugriff auf den Impala-Server.  
Kennwort Das Kennwort zur Authentifizierung des Zugriffs auf den Impala-Server.  
Größe des Transportpuffers Anzahl der Bytes, die im Arbeitsspeicher zur Pufferung nicht verschlüsselter Daten reserviert werden. 1000
Simple Authentication and Security Layer (SASL) verwenden Gibt an, ob der Treiber SASL zur Authentifizierung verwendet.  
Delegierungs-UID Sobald eine Benutzer-ID für diese Option festgelegt wird, delegiert der Impala-Treiber alle Operationen für Impala auf den festgelegten Benutzer statt auf den für die Verbindung authentifizierten Benutzer.  

Erweiterte Einstellungen

Einstellung Beschreibung Beispiel
SSL aktivieren

Legt fest, ob der Client eine SSL-verschlüsselte Verbindung zur Kommunikation mit dem Impala-Server verwendet.

 
Fehlende Übereinstimmung von allgemeinem Namen und Hostname zulassen Gibt an, ob ein SSL-Zertifikatsname einer Zertifizierungsstelle dem Hostnamen des Impala-Servers entsprechen muss.  
Selbstsigniertes Serverzertifikat erlauben Spezifiziert, ob der Treiber eine Verbindung zum Impala-Server mit einem selbstsignierten Zertifikat gestattet.  
Vertrauenswürdige Zertifikate Der vollständige Pfad der .pem-Datei, welche die vertrauenswürdigen Zertifizierungsstellenzertifikate zur Verifizierung des Servers mit SSL enthält.  
Systemeigene Abfrage verwenden Gibt an, ob der Treiber systemeigene Impala-SQL-Abfragen verwendet. Wenn diese Option nicht ausgewählt ist, wandelt der Treiber durch eine Anwendung übermittelte Anfragen in Impala SQL in eine äquivalente Form um. Wenn die Anwendung Impala-fähig ist und bereits Impala SQL ausgibt, aktivieren Sie diese Option, um den Mehraufwand der Abfragetransformation zu sparen.  
Simulierte Transaktionen etablieren Gibt an, ob der Treiber Transaktionen simulieren soll. Bei einer Deaktivierung gibt der Treiber einen Fehler zurück, falls er versucht, eine Abfrage mit Transaktionsanweisungen auszuführen.  
SQL-Unicode-Typen verwenden Legt fest, welche SQL-Typen für Zeichenfolgendatentypen zurückgegeben werden. Bei einer Aktivierung gibt der Treiber SQL_WVARCHAR für STRING- und VARCHAR-Spalten sowie SQL_WCHAR für CHAR-Spalten zurück.  
Abgerufene Zeilen pro Block Maximale Zeilenanzahl, die eine Abfrage auf einmal zurückgibt. 10000
Socket-Zeitüberschreitung

Anzahl der Sekunden, die das TCP-Socket auf eine Antwort vom Server wartet, bevor es zu einer Zeitüberschreitung der Anforderung kommt und eine Fehlermeldung zurückgegeben wird.

Falls dieser Wert auf „0“ festgelegt wurde, meldet das TCP-Socket bei Anfragen keine Zeitüberschreitungen.

30
Länge der Zeichenfolgenspalte Maximale Zeichenanzahl, die STRING-Spalten enthalten dürfen. 32767

Updates von Datenkonnektoren

Wenn Sie Analytics, den Robots-Agent oder AX Server aktualisieren, sollten Sie Ihre Skripts für Datenimporte mit einem der Analytics-Datenkonnektoren (Befehl ACCESSDATA) testen.

Es besteht die Möglichkeit, dass Änderungen eines Drittanbieters von Datenquellen oder eines Herstellers von ODBC-Treibern Aktualisierungen eines oder mehrerer Datenkonnektoren erfordert. Über Skripts hergestellte Datenverbindungen müssen unter Umständen aktualisiert werden, um nach wie vor ordnungsgemäß zu arbeiten.

  • Import erneut durchführen Die einfachste Möglichkeit, eine Verbindung zu aktualisieren, ist die manuelle Durchführung eines Imports mit dem Fenster „Datenzugriff“ der aktualisierten Version von Analytics. Kopieren Sie den Befehl ACCESSDATA aus dem Protokoll, und verwenden Sie ihn zur Aktualisierung Ihres Skripts.

    Hinweis

    Bevor Sie sich mit einer Datenquelle verbinden und den Import erneut ausführen, löschen Sie den Cache des Konnektors, um bestehende Tabellennamen zu entfernen.

    In der Registerkarte Bestehende Verbindungen des Fensters „Datenzugriff“ wählen Sie  > Cache löschen.

  • Feldspezifikationen aktualisieren Unter Umständen müssen Sie auch Feldspezifikationen im Skriptkörper aktualisieren, um die Änderungen des Tabellenschemas in der Datenquelle oder dem ODBC-Treiber anzupassen. Mögliche Änderungen beinhalten Feldnamen, Datentypen von Feldern sowie Feld- und Datensatzlängen.
  • Ergebnisse von Filtern überprüfen Sie sollten auch Ergebnisse von Filtern überprüfen, die Sie im Rahmen des Datenimports nutzen. Stellen Sie sicher, dass der Importfilter Datensätze ordnungsgemäß ein- und ausschließt.