Méthode join()

À partir d'une clé commune, combine les colonnes de deux cadres de données dans un seul cadre de données.

Syntaxe

nom_cadre_données_gauche.join(other = nom_cadre_données_droite, lkey = ["colonne_clé_gauche", "...n"], lcolumns = ["colonne_gauche", "...n"], rkey = ["colonne_clé_droite", "...n"], rcolumns = ["colonne_droite", "...n"], join_type = "inner"|"left"|"right"|"outer"|"unmatched")

Paramètres

Nom Description
other = nom_cadre_données_droite Nom du cadre de données secondaire droit.
lkey = ["colonne_clé_gauche", "...n"]

La ou les colonnes clés dans le cadre de données de gauche.

Les colonnes sont utilisées dans l'ordre indiqué. Si vous effectuez des jointures sur plusieurs colonnes, les colonnes correspondantes doivent être dans le même ordre dans lkey et dans rkey.

Remarque

La mise en correspondance des valeurs clés gauche et droite respecte la casse. Les valeurs correspondantes sont uniquement considérées comme identiques si leur casse est aussi identique.

lcolumns = ["colonne_gauche", "...n"]

facultatif

Les colonnes du cadre de données gauche à inclure dans le cadre de données de sortie joint. Les colonnes sont incluses dans l'ordre indiqué.

Si vous omettez lcolumns, toutes les colonnes du cadre de données de gauche sont incluses dans le cadre de données de sortie joint.

Si vous souhaitez exclure toutes les colonnes gauches, indiquez lcolumns = [].

Remarque

La ou les colonnes lkey sont automatiquement incluses dans le cadre de données de sortie. Vous ne devez pas nécessairement les re-spécifier dans lcolumns.

rkey = ["colonne_clé_droite", "...n"]

La ou les colonnes clés dans le cadre de données de droite.

Les colonnes sont utilisées dans l'ordre indiqué. Si vous effectuez des jointures sur plusieurs colonnes, les colonnes correspondantes doivent être dans le même ordre dans rkey et dans lkey.

Remarque

La mise en correspondance des valeurs clés gauche et droite respecte la casse. Les valeurs correspondantes sont uniquement considérées comme identiques si leur casse est aussi identique.

rcolumns = ["colonne_droite", "...n"]

facultatif

Les colonnes du cadre de données de droite à inclure dans le cadre de données de sortie joint. Les colonnes sont incluses dans l'ordre indiqué.

Si vous omettez rcolumns, toutes les colonnes du cadre de données de droite sont incluses dans le cadre de données de sortie joint.

Si vous souhaitez exclure toutes les colonnes de droite, indiquez rcolumns = [].

rcolumns est ignoré si vous utilisez le type de jointure unmatched.

Remarque

La ou les colonnes rkey sont automatiquement incluses dans le cadre de données de sortie. Vous ne devez pas nécessairement les re-spécifier dans rcolumns.

join_type = "inner" | "left" | "right" | "outer" | "unmatched"

facultatif

Type de jointure à effectuer.

Si vous omettez join_type une jointure interne est effectuée par défaut.

Type de jointure Le cadre de données de sortie jointe contient :

"inner"

toutes les lignes de gauche correspondantes et toutes les lignes de droite correspondantes

une ligne pour chaque correspondance entre les cadres de données de gauche et de droite

"left"

Toutes les lignes de gauche (correspondantes et non correspondantes) et toutes les lignes de droite correspondantes

"right"

Toutes les lignes de droite (correspondantes et non correspondantes) et toutes les lignes de gauche correspondantes

"outer"

Toutes les lignes de droite et de gauche (correspondantes et non correspondantes)

"unmatched"

Lignes de gauche non correspondantes

Renvoie

Un cadre de données HCL.

Exemples

Joindre deux cadres de données pour détecter les employés susceptibles d'être aussi des fournisseurs

L'exemple ci-dessous joint le cadre de données (gauche) employees et le cadre de données (droite) vendors en utilisant l'adresse comme colonne clé commune (colonnes Adress et Vendor_Street).

La méthode join() crée un nouveau cadre de données avec les lignes de gauche et de droite correspondantes, ce qui génère la liste des employés et des fournisseurs ayant la même adresse.

employee_vendor_match = employees.join(other = vendors, lkey = ["Address"], lcolumns = ["Empno", "First", "Last"], rkey = ["Vendor_Street"], rcolumns = ["Vendor_No", "Vendor_Name"], join_type = "inner")

Joindre deux cadres de données pour découvrir des lignes de créances clients sans client qui correspond

L'exemple ci-dessous joint le cadre de données (de gauche) accounts_receivable et le cadre de données (de droite) customers à l'aide du Customer Number (CustNo) comme colonne clé commune.

La méthode join() utilise le type de jointure unmatched pour créer un nouveau cadre de données contenant des lignes gauches non correspondantes, qui aboutit à une liste de lignes accounts_receivable qui ne sont pas associées à une ligne customers.

customers_not_found = accounts_receivable.join(other = customers, lkey = ["CustNo"], lcolumns = ["Due", "Amount"], rkey = ["CustNo"], join_type = "unmatched")