join()-Methode
Kombiniert Spalten zweier Datenrahmen in einem einzelnen Datenrahmen auf Basis eines gemeinsamen Schlüssels.
Syntax
linker_datenrahmen_name.join(other = rechter_datenrahmen_name, lkey = ["linke_schluesselspalte", "...n"], lcolumns = ["linke_spalte", "...n"], rkey = ["rechte_schluesselspalte", "...n"], rcolumns = ["rechte_spalte", "...n"], join_type = "inner"|"left"|"right"|"outer"|"unmatched")
Parameter
Name | Beschreibung | ||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
other = rechter_datenrahmen_name | Der Name des rechten Datenrahmens. | ||||||||||||||||||
lkey = ["linke_schluesselspalte", "...n"] |
Die Schlüsselspalte oder -spalten im linken Datenrahmen. Spalten werden in derselben Reihenfolge verwendet, in der Sie sie auflisten. Wenn Sie über mehr als eine Spalte zusammenführen, müssen die entsprechenden Spalten in lkey und rkey dieselbe Reihenfolge haben. Hinweis Bei der Zuordnung von linken und rechten Schlüsselwerten wird die Groß- und Kleinschreibung beachtet. Übereinstimmende Werte werden nur dann als identisch betrachtet, wenn auch ihre Groß- und Kleinschreibung übereinstimmt. |
||||||||||||||||||
lcolumns = ["linke_spalte", "...n"] Optional |
Die in den zusammengeführten Ausgabedatenrahmen einzuschließenden Spalten aus dem linken Datenrahmen. Spalten werden in derselben Reihenfolge einbezogen, in der Sie sie auflisten. Wenn Sie lcolumns nicht angeben, werden alle Spalten aus dem linken Datenrahmen in den zusammengeführten Ausgabedatenrahmen aufgenommen. Geben Sie lcolumns = [] an, wenn alle linken Spalten ausgeschlossen werden sollen. Hinweis Die lkey-Spalten werden automatisch in den Ausgabedatenrahmen aufgenommen. Sie müssen sie nicht erneut in lcolumns angeben. |
||||||||||||||||||
rkey = ["rechte_schluesselspalte", "...n"] |
Die Schlüsselspalte oder -spalten im rechten Datenrahmen. Spalten werden in derselben Reihenfolge verwendet, in der Sie sie auflisten. Wenn Sie über mehr als eine Spalte zusammenführen, müssen die entsprechenden Spalten in rkey und lkey dieselbe Reihenfolge haben. Hinweis Bei der Zuordnung von linken und rechten Schlüsselwerten wird die Groß- und Kleinschreibung beachtet. Übereinstimmende Werte werden nur dann als identisch betrachtet, wenn auch ihre Groß- und Kleinschreibung übereinstimmt. |
||||||||||||||||||
rcolumns = ["rechte_spalte", "...n"] Optional |
Die in den zusammengeführten Ausgabedatenrahmen einzuschließenden Spalten aus dem rechten Datenrahmen. Spalten werden in derselben Reihenfolge einbezogen, in der Sie sie auflisten. Wenn Sie rcolumns nicht angeben, werden alle Spalten aus dem rechten Datenrahmen in den zusammengeführten Ausgabedatenrahmen aufgenommen. Geben Sie rcolumns = [] an, wenn alle rechten Spalten ausgeschlossen werden sollen. rcolumns wird nicht berücksichtigt, wenn Sie den Zusammenführungstyp unmatched (nicht übereinstimmend) verwenden. Hinweis Die rkey-Spalten werden automatisch in den Ausgabedatenrahmen aufgenommen. Sie müssen sie nicht erneut in rcolumns angeben. |
||||||||||||||||||
join_type = "inner" | "left" | "right" | "outer" | "unmatched" Optional |
Der durchzuführende Zusammenführungstyp. Wenn Sie join_type nicht angeben, wird standardmäßig ein Inner Join ausgeführt.
|
Gibt zurück
HCL-Datenrahmen zurück.
Beispiele
Zwei Datenrahmen zusammenführen, um Mitarbeiter zu finden, die auch Lieferanten sein könnten
Im folgenden Beispiel werden die Datenrahmen employees (links) und vendors (rechts) mit Hilfe der gemeinsamen Schlüsselspalte der Anschrift (Spalten „Address“ und „Vendor_Street“) zusammengeführt.
Die join()-Methode erstellt einen neuen Datenrahmen mit übereinstimmenden linken und rechten Zeilen. Dies führt zu einer Liste von Mitarbeitern und Lieferanten mit der gleichen Adresse.
employee_vendor_match = employees.join(other = vendors, lkey = ["Address"], lcolumns = ["Empno", "First", "Last"], rkey = ["Vendor_Street"], rcolumns = ["Vendor_No", "Vendor_Name"], join_type = "inner")
Zwei Datenrahmen zusammenführen, um Forderungszeilen ohne übereinstimmenden Kunden zu finden
Im folgenden Beispiel werden die Datenrahmen accounts_receivable (links) und customers (rechts) mit Hilfe der gemeinsamen Schlüsselspalte der Kundennummer (CustNo) zusammengeführt.
Die join()-Methode verwendet den unmatched-Zusammenführungstyp, um einen neuen Datenrahmen mit nicht übereinstimmenden linken Zeilen zu erstellen. Dies führt zu einer Liste von Zeilen aus accounts_receivable, die keinen Zeilen aus customers zugeordnet sind.
customers_not_found = accounts_receivable.join(other = customers, lkey = ["CustNo"], lcolumns = ["Due", "Amount"], rkey = ["CustNo"], join_type = "unmatched")