join()-Methode

Kombiniert Spalten zweier Datenrahmen in einem einzelnen Datenrahmen auf Basis eines gemeinsamen Schlüssels.

Syntax

linker_datenrahmen_name.join(other = rechter_datenrahmen_name, lkey = ["linke_schluesselspalte", "...n"], lcolumns = ["linke_spalte", "...n"], rkey = ["rechte_schluesselspalte", "...n"], rcolumns = ["rechte_spalte", "...n"], join_type = "inner"|"left"|"right"|"outer"|"unmatched")

Parameter

Name Beschreibung
other = rechter_datenrahmen_name Der Name des rechten Datenrahmens.
lkey = ["linke_schluesselspalte", "...n"]

Die Schlüsselspalte oder -spalten im linken Datenrahmen.

Spalten werden in derselben Reihenfolge verwendet, in der Sie sie auflisten. Wenn Sie über mehr als eine Spalte zusammenführen, müssen die entsprechenden Spalten in lkey und rkey dieselbe Reihenfolge haben.

Hinweis

Bei der Zuordnung von linken und rechten Schlüsselwerten wird die Groß- und Kleinschreibung beachtet. Übereinstimmende Werte werden nur dann als identisch betrachtet, wenn auch ihre Groß- und Kleinschreibung übereinstimmt.

lcolumns = ["linke_spalte", "...n"]

Optional

Die in den zusammengeführten Ausgabedatenrahmen einzuschließenden Spalten aus dem linken Datenrahmen. Spalten werden in derselben Reihenfolge einbezogen, in der Sie sie auflisten.

Wenn Sie lcolumns nicht angeben, werden alle Spalten aus dem linken Datenrahmen in den zusammengeführten Ausgabedatenrahmen aufgenommen.

Geben Sie lcolumns = [] an, wenn alle linken Spalten ausgeschlossen werden sollen.

Hinweis

Die lkey-Spalten werden automatisch in den Ausgabedatenrahmen aufgenommen. Sie müssen sie nicht erneut in lcolumns angeben.

rkey = ["rechte_schluesselspalte", "...n"]

Die Schlüsselspalte oder -spalten im rechten Datenrahmen.

Spalten werden in derselben Reihenfolge verwendet, in der Sie sie auflisten. Wenn Sie über mehr als eine Spalte zusammenführen, müssen die entsprechenden Spalten in rkey und lkey dieselbe Reihenfolge haben.

Hinweis

Bei der Zuordnung von linken und rechten Schlüsselwerten wird die Groß- und Kleinschreibung beachtet. Übereinstimmende Werte werden nur dann als identisch betrachtet, wenn auch ihre Groß- und Kleinschreibung übereinstimmt.

rcolumns = ["rechte_spalte", "...n"]

Optional

Die in den zusammengeführten Ausgabedatenrahmen einzuschließenden Spalten aus dem rechten Datenrahmen. Spalten werden in derselben Reihenfolge einbezogen, in der Sie sie auflisten.

Wenn Sie rcolumns nicht angeben, werden alle Spalten aus dem rechten Datenrahmen in den zusammengeführten Ausgabedatenrahmen aufgenommen.

Geben Sie rcolumns = [] an, wenn alle rechten Spalten ausgeschlossen werden sollen.

rcolumns wird nicht berücksichtigt, wenn Sie den Zusammenführungstyp unmatched (nicht übereinstimmend) verwenden.

Hinweis

Die rkey-Spalten werden automatisch in den Ausgabedatenrahmen aufgenommen. Sie müssen sie nicht erneut in rcolumns angeben.

join_type = "inner" | "left" | "right" | "outer" | "unmatched"

Optional

Der durchzuführende Zusammenführungstyp.

Wenn Sie join_type nicht angeben, wird standardmäßig ein Inner Join ausgeführt.

Zusammenführungstyp Der zusammengeführte Ausgabedatenrahmen enthält:

„inner“

Alle übereinstimmenden linken Zeilen und alle übereinstimmenden rechten Zeilen

Eine Zeile für jede Übereinstimmung zwischen linken und rechten Datenrahmen

„left“

Alle linken Zeilen (übereinstimmend und nicht übereinstimmend) und alle übereinstimmenden rechten Zeilen

„right“

Alle rechten Zeilen (übereinstimmend und nicht übereinstimmend) und alle übereinstimmenden linken Zeilen

„outer“

Alle linken und alle rechten Zeilen (übereinstimmend und nicht übereinstimmend)

„unmatched“

Nicht übereinstimmende linke Zeilen

Gibt zurück

HCL-Datenrahmen zurück.

Beispiele

Zwei Datenrahmen zusammenführen, um Mitarbeiter zu finden, die auch Lieferanten sein könnten

Im folgenden Beispiel werden die Datenrahmen employees (links) und vendors (rechts) mit Hilfe der gemeinsamen Schlüsselspalte der Anschrift (Spalten „Address“ und „Vendor_Street“) zusammengeführt.

Die join()-Methode erstellt einen neuen Datenrahmen mit übereinstimmenden linken und rechten Zeilen. Dies führt zu einer Liste von Mitarbeitern und Lieferanten mit der gleichen Adresse.

employee_vendor_match = employees.join(other = vendors, lkey = ["Address"], lcolumns = ["Empno", "First", "Last"], rkey = ["Vendor_Street"], rcolumns = ["Vendor_No", "Vendor_Name"], join_type = "inner")

Zwei Datenrahmen zusammenführen, um Forderungszeilen ohne übereinstimmenden Kunden zu finden

Im folgenden Beispiel werden die Datenrahmen accounts_receivable (links) und customers (rechts) mit Hilfe der gemeinsamen Schlüsselspalte der Kundennummer (CustNo) zusammengeführt.

Die join()-Methode verwendet den unmatched-Zusammenführungstyp, um einen neuen Datenrahmen mit nicht übereinstimmenden linken Zeilen zu erstellen. Dies führt zu einer Liste von Zeilen aus accounts_receivable, die keinen Zeilen aus customers zugeordnet sind.

customers_not_found = accounts_receivable.join(other = customers, lkey = ["CustNo"], lcolumns = ["Due", "Amount"], rkey = ["CustNo"], join_type = "unmatched")