join() メソッド

共通キーに基づいて、2 つのデータフレームの列を単一のデータフレームに結合します。

構文

左データフレーム名.join(other = 右データフレーム名, lkey = ["左キー列", "...n"], lcolumns = ["左列", "...n"], rkey = ["右キー列", "...n"], rcolumns = ["右列", "...n"], join_type = "inner"|"left"|"right"|"outer"|"unmatched")

パラメーター

名前 説明
other = 右データフレーム名 右データフレームの名前。
lkey = ["左キー列", "...n"]

左データフレームのキー列。

列はリスト出力する順序で使用されます。複数の列を結合している場合は、lkey rkey で対応する列が同じ順序でなければなりません。

メモ

左キー値および右キー値の一致は大文字と小文字を区別します。大文字と小文字が同じ場合にのみ、一致する値が同一であると見なされます。

lcolumns = ["左列", "...n"]

省略可能

結合された出力データフレームに含める左データフレームの列。列はリスト出力する順序で含まれます。

lcolumns を省略する場合、左データフレームのすべての列が結合された出力データフレームに含まれます。

すべての左列を除外する場合は、lcolumns = [] を指定します。

メモ

lkey 列は自動的に出力データフレームに含まれます。lcolumns でもう一度指定する必要はありません。

rkey = ["右キー列", "...n"]

右データフレームのキー列。

列はリスト出力する順序で使用されます。複数の列を結合している場合は、rkey lkey で対応する列が同じ順序でなければなりません。

メモ

左キー値および右キー値の一致は大文字と小文字を区別します。大文字と小文字が同じ場合にのみ、一致する値が同一であると見なされます。

rcolumns = ["右列", "...n"]

省略可能

結合された出力データフレームに含める右データフレームの列。列はリスト出力する順序で含まれます。

rcolumns を省略する場合、右データフレームのすべての列が結合された出力データフレームに含まれます。

すべての右列を除外する場合は、rcolumns = [] を指定します。

unmatched 結合タイプを使用する場合、rcolumns は無視されます。

メモ

rkey 列は自動的に出力データフレームに含まれます。rcolumns でもう一度指定する必要はありません。

join_type = "inner" | "left" | "right" | "outer" | "unmatched"

省略可能

実行する結合の種類。

join_type を省略する場合は、デフォルトで内部結合が実行されます。

結合タイプ 結合された出力データフレームの内容:

"inner"

すべての一致した左行とすべての一致した右行

左データフレームと右データフレーム間の各一致に 1 つの行

"left"

すべての左行 (一致した行と一致しない行) とすべての一致した右行

"right"

すべての右行 (一致した行と一致しない行) とすべての一致した左行

"outer"

すべての左行とすべての右行 (一致した行と一致しない行)

"unmatched"

一致しない左行

戻り値

HCL データフレーム。

業者である可能性がある従業員を検索するための方法として、2 つのデータフレームを結合する

次の例は、共通キー列として住所 (Address および Vendor_Street 列) を使用し、employees データフレーム (左) および vendors データフレーム (右) を結合します。

join() メソッドは、新しいデータフレームと、一致する左および右行を作成します。これにより、同じ住所の従業員と業者のリストが作成されます。

employee_vendor_match = employees.join(other = vendors, lkey = ["Address"], lcolumns = ["Empno", "First", "Last"], rkey = ["Vendor_Street"], rcolumns = ["Vendor_No", "Vendor_Name"], join_type = "inner")

一致する顧客がない売掛金行を検出する方法として、2 つのデータフレームを結合します。

次の例は、顧客番号 (CustNo) を共通キー列として使用して、accounts_receivable データフレーム(左)と customers データフレーム (右) を結合します。

join() メソッドは、unmatched 結合タイプを使用して、不一致の左行を含む新しいデータフレームを作成します。その結果、どの customers 行にも関連付けられていない accounts_receivable 行の一覧が生成されます。

customers_not_found = accounts_receivable.join(other = customers, lkey = ["CustNo"], lcolumns = ["Due", "Amount"], rkey = ["CustNo"], join_type = "unmatched")