Mit Cloudera Impala verbinden
Konzept-Informationen
Cloudera Impala ist ein Cloud-Datendienst. Sie können den Cloudera-Impala-Datenkonnektor verwenden, um die in Impala gespeicherten Daten Ihrer Organisation zu importieren.
Hinweis
Analytics bietet Impala als optionalen Konnektor an. Falls er in Ihrem Fenster „Datenzugriff“ nicht verfügbar ist, wurde er während der Installation wahrscheinlich nicht ausgewählt. Weitere Informationen finden Sie unter Optionale Analytics-Datenkonnektoren und Python Engine installieren.
Vorbereitungen
Für eine Verbindung mit Impala müssen Sie die folgenden Informationen einholen:
- Benutzername
- Kennwort
- Lesezugriff
Hilfe für die Zusammenstellung der Verbindungsvoraussetzungen erhalten Sie vom Impala-Administrator Ihrer Organisation. Falls Ihr Administrator Ihnen nicht weiterhelfen kann, sollten Sie oder Ihr Administrator den Impala-Support kontaktieren.
Eine Impala-Verbindung erstellen
- Wählen Sie aus dem Analytics-Hauptmenü Importieren > Datenbank und Anwendung.
- Auf der Registerkarte Neue Verbindungen im Abschnitt ACL-Konnektoren wählen Sie Impala.
Tipp
Sie können die Liste verfügbarer Konnektoren filtern, indem Sie in das Feld Verbindungen filtern eine Suchzeichenfolge eingeben. Die Konnektoren sind alphabetisch aufgelistet.
- Im Bereich Datenverbindungseinstellungen rufen Sie die Verbindungseinstellungen auf und klicken unten innerhalb des Bereichs auf Speichern und verbinden.
Sie können den standardmäßigen Verbindungsnamen akzeptieren oder einen neuen Namen eingeben.
Die Verbindung für Impala wird in der Registerkarte Bestehende Verbindungen gespeichert. In Zukunft können Sie sich über die gespeicherte Verbindung erneut mit Impala verbinden.
Sobald die Verbindung hergestellt ist, wird das Fenster „Datenzugriff“ im Stagingbereich geöffnet und Sie können den Datenimport beginnen. Hilfe für den Datenimport aus Impala finden Sie unter Mit dem Fenster „Datenzugriff“ arbeiten.
Verbindungseinstellungen
Grundlegende Einstellungen
Einstellung | Beschreibung | Beispiel |
---|---|---|
Host |
Die IP-Adresse oder der Hostname des Impala-Servers. |
|
Port | Der Port für die Verbindung mit der Impala-Serverinstanz. | |
Datenbank | Name der standardmäßig zu verwendenden Impala-Datenbank. | |
Authentifizierungsmechanismus |
Der zu verwendende Authentifizierungsmechanismus. Verfügbare Optionen sind:
|
Keine Authentifizierung |
Bereich | Bereich des Impala-Hosts. | |
Host-FQDN | Vollqualifizierter Domänenname des Impala-Hosts. | _HOST |
Dienstname | Der Kerberos-Dienstprinzipalname des Impala-Servers. | Impala |
Benutzername | Der Benutzername für den Zugriff auf den Impala-Server. | |
Kennwort | Das Kennwort zur Authentifizierung des Zugriffs auf den Impala-Server. | |
Größe des Transportpuffers | Anzahl der Bytes, die im Arbeitsspeicher zur Pufferung nicht verschlüsselter Daten reserviert werden. | 1000 |
Simple Authentication and Security Layer (SASL) verwenden | Gibt an, ob der Treiber SASL zur Authentifizierung verwendet. | |
Delegierungs-UID | Sobald eine Benutzer-ID für diese Option festgelegt wird, delegiert der Impala-Treiber alle Operationen für Impala auf den festgelegten Benutzer statt auf den für die Verbindung authentifizierten Benutzer. |
Erweiterte Einstellungen
Einstellung | Beschreibung | Beispiel |
---|---|---|
SSL aktivieren |
Legt fest, ob der Client eine SSL-verschlüsselte Verbindung zur Kommunikation mit dem Impala-Server verwendet. |
|
Fehlende Übereinstimmung von allgemeinem Namen und Hostname zulassen | Gibt an, ob ein SSL-Zertifikatsname einer Zertifizierungsstelle dem Hostnamen des Impala-Servers entsprechen muss. | |
Selbstsigniertes Serverzertifikat erlauben | Spezifiziert, ob der Treiber eine Verbindung zum Impala-Server mit einem selbstsignierten Zertifikat gestattet. | |
Vertrauenswürdige Zertifikate | Der vollständige Pfad der .pem-Datei, welche die vertrauenswürdigen Zertifizierungsstellenzertifikate zur Verifizierung des Servers mit SSL enthält. | |
Systemeigene Abfrage verwenden | Gibt an, ob der Treiber systemeigene Impala-SQL-Abfragen verwendet. Wenn diese Option nicht ausgewählt ist, wandelt der Treiber durch eine Anwendung übermittelte Anfragen in Impala SQL in eine äquivalente Form um. Wenn die Anwendung Impala-fähig ist und bereits Impala SQL ausgibt, aktivieren Sie diese Option, um den Mehraufwand der Abfragetransformation zu sparen. | |
Simulierte Transaktionen etablieren | Gibt an, ob der Treiber Transaktionen simulieren soll. Bei einer Deaktivierung gibt der Treiber einen Fehler zurück, falls er versucht, eine Abfrage mit Transaktionsanweisungen auszuführen. | |
SQL-Unicode-Typen verwenden | Legt fest, welche SQL-Typen für Zeichenfolgendatentypen zurückgegeben werden. Bei einer Aktivierung gibt der Treiber SQL_WVARCHAR für STRING- und VARCHAR-Spalten sowie SQL_WCHAR für CHAR-Spalten zurück. | |
Abgerufene Zeilen pro Block | Maximale Zeilenanzahl, die eine Abfrage auf einmal zurückgibt. | 10000 |
Socket-Zeitüberschreitung |
Anzahl der Sekunden, die das TCP-Socket auf eine Antwort vom Server wartet, bevor es zu einer Zeitüberschreitung der Anforderung kommt und eine Fehlermeldung zurückgegeben wird. Falls dieser Wert auf „0“ festgelegt wurde, meldet das TCP-Socket bei Anfragen keine Zeitüberschreitungen. |
30 |
Länge der Zeichenfolgenspalte | Maximale Zeichenanzahl, die STRING-Spalten enthalten dürfen. | 32767 |
Updates von Datenkonnektoren
Wenn Sie Analytics, den Robots-Agent oder AX Server aktualisieren, sollten Sie Ihre Skripts für Datenimporte mit einem der Analytics-Datenkonnektoren (Befehl ACCESSDATA) testen.
Es besteht die Möglichkeit, dass Änderungen eines Drittanbieters von Datenquellen oder eines Herstellers von ODBC-Treibern Aktualisierungen eines oder mehrerer Datenkonnektoren erfordert. Über Skripts hergestellte Datenverbindungen müssen unter Umständen aktualisiert werden, um nach wie vor ordnungsgemäß zu arbeiten.
- Import erneut durchführen Die einfachste Möglichkeit, eine Verbindung zu aktualisieren, ist die manuelle Durchführung eines Imports mit dem Fenster „Datenzugriff“ der aktualisierten Version von Analytics. Kopieren Sie den Befehl ACCESSDATA aus dem Protokoll, und verwenden Sie ihn zur Aktualisierung Ihres Skripts.
Hinweis
Bevor Sie sich mit einer Datenquelle verbinden und den Import erneut ausführen, löschen Sie den Cache des Konnektors, um bestehende Tabellennamen zu entfernen.
In der Registerkarte Bestehende Verbindungen des Fensters „Datenzugriff“ wählen Sie
> Cache löschen.
- Feldspezifikationen aktualisieren Unter Umständen müssen Sie auch Feldspezifikationen im Skriptkörper aktualisieren, um die Änderungen des Tabellenschemas in der Datenquelle oder dem ODBC-Treiber anzupassen. Mögliche Änderungen beinhalten Feldnamen, Datentypen von Feldern sowie Feld- und Datensatzlängen.
- Ergebnisse von Filtern überprüfen Sie sollten auch Ergebnisse von Filtern überprüfen, die Sie im Rahmen des Datenimports nutzen. Stellen Sie sicher, dass der Importfilter Datensätze ordnungsgemäß ein- und ausschließt.