Mit Apache Drill verbinden
Wenden Sie sich an den Support von Diligent, um Unterstützung zu erhalten.
Konzept-Informationen
Drill ist ein Open-Source-Modul von Apache für SQL-Abfragen, das eine leistungsstarke Analyse teilweise strukturierter Daten aus Big-Data-Anwendungen ermöglicht. Verwenden Sie den Apache-Drill-Datenkonnektor, um die Drill-Daten Ihrer Organisation zu importieren.
Hinweis
Analytics bietet Drill als optionalen Konnektor an. Falls er in Ihrem Fenster „Datenzugriff“ nicht verfügbar ist, wurde er während der Installation wahrscheinlich nicht ausgewählt. Weitere Informationen finden Sie unter Optionale Analytics-Datenkonnektoren und Python Engine installieren.
Vorbereitungen
Für eine Verbindung mit Drill müssen Sie die folgenden Informationen einholen:
- den korrekten Authentifizierungstyp (einfach oder keinen)
- Benutzernamen und Kennwort, falls Sie eine einfache Authentifizierung nutzen
- den richtigen Verbindungstyp (eingebetteter Modus „Direct to Drillbit“ oder verteilter Modus „Zookeeper“)
- Host und Port für Drillbit oder jeden Knoten bei einer Verwendung des verteilten Modus
Im verteilten Modus müssen der Host und der Port im Format einer durch Kommas getrennten Liste in das Feld Quorum eingegeben werden:
<Hostname/IP-Adresse> : <Port>, <Hostname/IP-Adresse> : <Port>, . . .
- Name des Drillbit-Clusters bei der Verwendung des verteilten Modus
Hilfe für die Zusammenstellung der Verbindungsvoraussetzungen erhalten Sie vom Apache Drill-Administrator Ihrer Organisation. Falls Ihr Administrator Ihnen nicht weiterhelfen kann, sollten Sie oder Ihr Administrator den Apache Drill-Support kontaktieren.
Fortgeschrittene Verbindungseigenschaften finden Sie in der Online-Hilfe von Apache Drill unter ODBC für Windows konfigurieren.
Eine Drill-Verbindung erstellen
- Wählen Sie aus dem Analytics-Hauptmenü Importieren > Datenbank und Anwendung.Analytics
- Auf der Registerkarte Neue Verbindungen im Abschnitt ACL-Konnektoren wählen Sie Apache Drill.
Tipp
Sie können die Liste verfügbarer Konnektoren filtern, indem Sie in das Feld Verbindungen filtern eine Suchzeichenfolge eingeben. Die Konnektoren sind alphabetisch aufgelistet.
- Im Bereich Datenverbindungseinstellungen rufen Sie die Verbindungseinstellungen auf und klicken unten innerhalb des Bereichs auf Speichern und verbinden.
Sie können den standardmäßigen Verbindungsnamen akzeptieren oder einen neuen Namen eingeben.
Die Verbindung für Apache Drill wird in der Registerkarte Bestehende Verbindungen gespeichert. In Zukunft können Sie sich über die gespeicherte Verbindung erneut mit Apache Drill verbinden.
Sobald die Verbindung hergestellt ist, wird das Fenster „Datenzugriff“ im Stagingbereich geöffnet und Sie können den Datenimport beginnen. Hilfe für den Datenimport aus Apache Drill finden Sie unter Mit dem Fenster „Datenzugriff“ arbeiten.
Verbindungseinstellungen
Grundlegende Einstellungen
Einstellung | Beschreibung | Beispiel |
---|---|---|
Verbindungstyp |
Gibt den Verbindungstyp des Treibers an. Verfügbare Optionen sind:
|
An Drillbit adressieren |
Quorum | Geben Sie den oder die Server in Ihrem ZooKeeper-Cluster an. Mehrere Server können Sie mit einem Komma (,) abtrennen. | |
Cluster-ID | Der Name des ZooKeeper-Clusters, mit dem sich der Treiber verbindet. | drillbits1 |
Host | Die IP-Adresse oder der Hostname des Drill-Servers. | localhost |
Port | Der TCP-Port, den der Drill-Server verwendet, um auf eingehende Client-Verbindungen zu warten. | 31010 |
Authentifizierungstyp |
Gibt an, wie der Treiber die Verbindung mit Drill authentifiziert. Verfügbare Optionen sind:
|
Keine Authentifizierung |
Benutzer | Benutzername zur Authentifizierung mit dem Drill-Server. | |
Kennwort | Kennwort zur Authentifizierung mit dem Drill-Server. | |
Katalog | Name des synthetischen Katalogs, in dem alle Schemas/Datenbanken organisiert sind. Dieser Katalogname wird als Wert für SQL_DATABASE_NAME oder CURRENT CATALOG verwendet. | DRILL |
Standardschema | Name des zu verwendenden Datenbankschemas, falls in der Abfrage kein Schema explizit angegeben wird. Sie können Abfragen für andere Schemas durchführen, falls Sie in der Abfrage das Schema explizit angeben. | |
Async deaktivieren | Gibt an, ob der Treiber asynchrone Abfragen unterstützt. |
Erweiterte Einstellungen
Einstellung | Beschreibung | Beispiel |
---|---|---|
Erweiterte Eigenschaften |
Zur Konfiguration des Treibers. Trennen Sie jede erweiterte Eigenschaft mit einem Semikolon (;) und umschließen Sie dann alle erweiterten Eigenschaften in einer Verbindungszeichenfolge mit geschweiften Klammern ({ }). |
CastAnyToVarchar=true; HandshakeTimeout=5; QueryTimeout=180; TimestampTZDisplayTimezone=local; ExcludedSchemas=sys,INFORMATION_SCHEMA; NumberOfPrefetchBuffers=5 |