Mit Apache Cassandra verbinden
Apache Cassandra ist ein NoSQL-Datenbank-Verwaltungssystem. Verwenden Sie den Apache-Cassandra-Datenkonnektor, um die Cassandra-Daten Ihres Unternehmens zu importieren.
Vorbereitungen
Für eine Verbindung mit Cassandra müssen Sie die folgenden Informationen einholen:
- Hostname des Datenbankservers
- korrekter Verbindungsport
- Ihren Benutzernamen und Ihr Kennwort, falls Sie eine Authentifizierung nutzen
Hilfe für die Zusammenstellung der Verbindungsvoraussetzungen erhalten Sie von dem Cassandra-Administrator Ihrer Organisation. Falls Ihr Administrator Ihnen nicht weiterhelfen kann, sollten Sie oder Ihr Administrator den Cassandra-Support kontaktieren.
Eine Cassandra-Verbindung erstellen
- Wählen Sie aus dem Analytics-Hauptmenü Importieren > Datenbank und Anwendung.
- Auf der Registerkarte Neue Verbindungen im Abschnitt ACL-Konnektoren wählen Sie Cassandra.
Tipp
Sie können die Liste verfügbarer Konnektoren filtern, indem Sie in das Feld Verbindungen filtern eine Suchzeichenfolge eingeben. Die Konnektoren sind alphabetisch aufgelistet.
- Im Bereich Datenverbindungseinstellungen rufen Sie die Verbindungseinstellungen auf und klicken unten innerhalb des Bereichs auf Speichern und verbinden.
Sie können den standardmäßigen Verbindungsnamen akzeptieren oder einen neuen Namen eingeben.
Die Verbindung für Cassandra wird in der Registerkarte Bestehende Verbindungen gespeichert. In Zukunft können Sie sich über die gespeicherte Verbindung erneut mit Cassandra verbinden.
Sobald die Verbindung hergestellt ist, wird das Fenster „Datenzugriff“ im Stagingbereich geöffnet und Sie können den Datenimport beginnen. Hilfe für den Datenimport aus Cassandra finden Sie unter Mit dem Fenster „Datenzugriff“ arbeiten.
Cassandra abfragen
Ein Vorteil des Apache-Cassandra-Entwurfs besteht in der Möglichkeit, denormalisierte Daten in weniger Tabellen zu speichern. Durch die Verwendung verschachtelter Datenstrukturen wie Mengen, Listen und Strukturen können Transaktionen vereinfacht werden. Analytics unterstützt jedoch keinen Zugriff auf diese Datentypen. Indem die Daten innerhalb solcher Sammlungen (Mengen, Listen und Strukturen) in virtuellen Tabellen erneut normalisiert werden, ermöglicht der Konnektor den Benutzern eine direkte Interaktion mit den Daten, während diese weiterhin in ihrer denormalisierten Form in Cassandra gespeichert sind.
Wenn eine Tabelle Sammlungsspalten enthält, erstellt der Konnektor bei der ersten Abfrage der Tabelle die folgenden virtuellen Tabellen:
- eine „Basistabelle“, welche dieselben Daten wie die echte Tabelle mit Ausnahme der Sammlungsspalten enthält.
- Eine virtuelle Tabelle für jede Sammlungsspalte, welche die verschachtelten Daten erweitert.
Virtuelle Tabellen beziehen sich auf die Daten der echten Tabelle und ermöglichen dem Konnektor einen Zugriff auf die denormalisierten Daten. Durch eine Abfrage der virtuellen Tabellen können Sie auf Inhalte der Cassandra-Sammlungen über ODBC zugreifen.
Die Basistabelle und die virtuellen Tabellen erscheinen in der Liste der innerhalb der Datenbank bestehenden Tabellen als zusätzliche Tabellen. Die Basistabelle hat denselben Namen wie die echte, durch sie repräsentierte Tabelle. Virtuelle Tabellen, die Sammlungen repräsentieren, werden mit dem Namen der echten Tabelle, einem Trennzeichen (standardmäßig _vt_) und dem Namen der Spalte benannt.
Beispiel
Beispieltabelle ist eine Cassandra-Datenbanktabelle, die eine primäre ganzzahlige Schlüsselspalte namens pk_int, eine Listenspalte, eine Strukturspalte und eine Mengenspalte (namens Zeichenfolgenmenge) enthält.
Quelltabelle mit Sammlungen
pk_int | Liste | Struktur | Zeichenfolgenmenge |
---|---|---|---|
1 | ["1","2","3"] | {"S1" : "a", "S2" : "b"} | {"a", "b", "c"} |
3 | ["100","101","102","105"] | {"S1" : "t"} | {"a","e"} |
Der Konnektor erstellt mehrere virtuelle Tabellen, um diese einzelne Tabelle zu repräsentieren. Die erste virtuelle Tabelle ist die Basistabelle:
Basistabelle
pk_int |
---|
1 |
3 |
Die Basistabelle enthält dieselben Daten wie die ursprüngliche Datenbanktabelle mit Ausnahme der Sammlungen. Diese werden in der Basistabelle übersprungen und in anderen virtuellen Tabellen erweitert.
Die folgenden Tabellen zeigen die virtuellen Tabellen, in denen die Daten der Spalten Liste, Struktur und Zeichenfolgenmenge erneut normalisiert werden:
Liste
pk_int | Liste#index | Liste#value |
---|---|---|
1 | 0 | 1 |
1 | 1 | 2 |
1 | 2 | 3 |
3 | 0 | 100 |
3 | 1 | 101 |
3 | 2 | 102 |
3 | 3 | 105 |
Struktur
pk_int | Struktur#key | Struktur#value |
---|---|---|
1 | S1 | a |
1 | S2 | b |
3 | S1 | t |
Zeichenfolgenmenge
pk_int | Zeichenfolgenmenge#value |
---|---|
1 | a |
1 | b |
1 | c |
3 | a |
3 | e |
Die Fremdschlüsselspalten in den virtuellen Tabellen verweisen auf die Primärschlüsselspalten in der echten Tabelle und deuten an, welcher Zeile der echten Tabelle die Zeile der virtuellen Tabelle entspricht. Die Spalten, deren Namen mit #index oder #key enden, geben die Position der Daten innerhalb der ursprünglichen Liste oder Struktur an. Die Spalten, deren Namen mit #value enden, beinhalten die erweiterten Daten aus der Sammlung.
Updates von Datenkonnektoren
Wenn Sie Analytics, den Robots-Agent oder AX Server aktualisieren, sollten Sie Ihre Skripts für Datenimporte mit einem der Analytics-Datenkonnektoren (Befehl ACCESSDATA) testen.
Es besteht die Möglichkeit, dass Änderungen eines Drittanbieters von Datenquellen oder eines Herstellers von ODBC-Treibern Aktualisierungen eines oder mehrerer Datenkonnektoren erfordert. Über Skripts hergestellte Datenverbindungen müssen unter Umständen aktualisiert werden, um nach wie vor ordnungsgemäß zu arbeiten.
- Import erneut durchführen Die einfachste Möglichkeit, eine Verbindung zu aktualisieren, ist die manuelle Durchführung eines Imports mit dem Fenster „Datenzugriff“ der aktualisierten Version von Analytics. Kopieren Sie den Befehl ACCESSDATA aus dem Protokoll, und verwenden Sie ihn zur Aktualisierung Ihres Skripts.
Hinweis
Bevor Sie sich mit einer Datenquelle verbinden und den Import erneut ausführen, löschen Sie den Cache des Konnektors, um bestehende Tabellennamen zu entfernen.
In der Registerkarte Bestehende Verbindungen des Fensters „Datenzugriff“ wählen Sie
> Cache löschen.
- Feldspezifikationen aktualisieren Unter Umständen müssen Sie auch Feldspezifikationen im Skriptkörper aktualisieren, um die Änderungen des Tabellenschemas in der Datenquelle oder dem ODBC-Treiber anzupassen. Mögliche Änderungen beinhalten Feldnamen, Datentypen von Feldern sowie Feld- und Datensatzlängen.
- Ergebnisse von Filtern überprüfen Sie sollten auch Ergebnisse von Filtern überprüfen, die Sie im Rahmen des Datenimports nutzen. Stellen Sie sicher, dass der Importfilter Datensätze ordnungsgemäß ein- und ausschließt.
Änderungen des Apache-Cassandra-Datenkonnektors
Spezifische Änderungen des Apache-Cassandra-Datenkonnektors sind im Folgenden aufgelistet.
Analytics-Version | Ändern |
---|---|
14.2 |
Der Konnektor unterstützt keine Verbindungen zu Apache Cassandra 2.0 mehr. Verbindungen können mit Apache Cassandra 2.1, 2.2 und 3.0 aufgenommen werden. |