join() メソッド
共通キーに基づいて、2 つのデータフレームの列を単一のデータフレームに結合します。
構文
左データフレーム名.join(other = 右データフレーム名, lkey = ["左キー列", "...n"], lcolumns = ["左列", "...n"], rkey = ["右キー列", "...n"], rcolumns = ["右列", "...n"], join_type = "inner"|"left"|"right"|"outer"|"unmatched")
パラメーター
名前 | 説明 | ||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
other = 右データフレーム名 | 右データフレームの名前。 | ||||||||||||||||||
lkey = ["左キー列", "...n"] |
左データフレームのキー列。 列はリスト出力する順序で使用されます。複数の列を結合している場合は、lkey と rkey で対応する列が同じ順序でなければなりません。 メモ 左キー値および右キー値の一致は大文字と小文字を区別します。大文字と小文字が同じ場合にのみ、一致する値が同一であると見なされます。 |
||||||||||||||||||
lcolumns = ["左列", "...n"] 省略可能 |
結合された出力データフレームに含める左データフレームの列。列はリスト出力する順序で含まれます。 lcolumns を省略する場合、左データフレームのすべての列が結合された出力データフレームに含まれます。 すべての左列を除外する場合は、lcolumns = [] を指定します。 メモ lkey 列は自動的に出力データフレームに含まれます。lcolumns でもう一度指定する必要はありません。 |
||||||||||||||||||
rkey = ["右キー列", "...n"] |
右データフレームのキー列。 列はリスト出力する順序で使用されます。複数の列を結合している場合は、rkey と lkey で対応する列が同じ順序でなければなりません。 メモ 左キー値および右キー値の一致は大文字と小文字を区別します。大文字と小文字が同じ場合にのみ、一致する値が同一であると見なされます。 |
||||||||||||||||||
rcolumns = ["右列", "...n"] 省略可能 |
結合された出力データフレームに含める右データフレームの列。列はリスト出力する順序で含まれます。 rcolumns を省略する場合、右データフレームのすべての列が結合された出力データフレームに含まれます。 すべての右列を除外する場合は、rcolumns = [] を指定します。 unmatched 結合タイプを使用する場合、rcolumns は無視されます。 メモ rkey 列は自動的に出力データフレームに含まれます。rcolumns でもう一度指定する必要はありません。 |
||||||||||||||||||
join_type = "inner" | "left" | "right" | "outer" | "unmatched" 省略可能 |
実行する結合の種類。 join_type を省略する場合は、デフォルトで内部結合が実行されます。
|
戻り値
HCL データフレーム。
例
業者である可能性がある従業員を検索するための方法として、2 つのデータフレームを結合する
次の例は、共通キー列として住所 (Address および Vendor_Street 列) を使用し、employees データフレーム (左) および vendors データフレーム (右) を結合します。
join() メソッドは、新しいデータフレームと、一致する左および右行を作成します。これにより、同じ住所の従業員と業者のリストが作成されます。
employee_vendor_match = employees.join(other = vendors, lkey = ["Address"], lcolumns = ["Empno", "First", "Last"], rkey = ["Vendor_Street"], rcolumns = ["Vendor_No", "Vendor_Name"], join_type = "inner")
一致する顧客がない売掛金行を検出する方法として、2 つのデータフレームを結合します。
次の例は、顧客番号 (CustNo) を共通キー列として使用して、accounts_receivable データフレーム(左)と customers データフレーム (右) を結合します。
join() メソッドは、unmatched 結合タイプを使用して、不一致の左行を含む新しいデータフレームを作成します。その結果、どの customers 行にも関連付けられていない accounts_receivable 行の一覧が生成されます。
customers_not_found = accounts_receivable.join(other = customers, lkey = ["CustNo"], lcolumns = ["Due", "Amount"], rkey = ["CustNo"], join_type = "unmatched")