Méthode join()
À partir d'une clé commune, combine les colonnes de deux cadres de données dans un seul cadre de données.
Syntaxe
nom_cadre_données_gauche.join(other = nom_cadre_données_droite, lkey = ["colonne_clé_gauche", "...n"], lcolumns = ["colonne_gauche", "...n"], rkey = ["colonne_clé_droite", "...n"], rcolumns = ["colonne_droite", "...n"], join_type = "inner"|"left"|"right"|"outer"|"unmatched")
Paramètres
Nom | Description | ||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
other = nom_cadre_données_droite | Nom du cadre de données secondaire droit. | ||||||||||||||||||
lkey = ["colonne_clé_gauche", "...n"] |
La ou les colonnes clés dans le cadre de données de gauche. Les colonnes sont utilisées dans l'ordre indiqué. Si vous effectuez des jointures sur plusieurs colonnes, les colonnes correspondantes doivent être dans le même ordre dans lkey et dans rkey. Remarque La mise en correspondance des valeurs clés gauche et droite respecte la casse. Les valeurs correspondantes sont uniquement considérées comme identiques si leur casse est aussi identique. |
||||||||||||||||||
lcolumns = ["colonne_gauche", "...n"] facultatif |
Les colonnes du cadre de données gauche à inclure dans le cadre de données de sortie joint. Les colonnes sont incluses dans l'ordre indiqué. Si vous omettez lcolumns, toutes les colonnes du cadre de données de gauche sont incluses dans le cadre de données de sortie joint. Si vous souhaitez exclure toutes les colonnes gauches, indiquez lcolumns = []. Remarque La ou les colonnes lkey sont automatiquement incluses dans le cadre de données de sortie. Vous ne devez pas nécessairement les re-spécifier dans lcolumns. |
||||||||||||||||||
rkey = ["colonne_clé_droite", "...n"] |
La ou les colonnes clés dans le cadre de données de droite. Les colonnes sont utilisées dans l'ordre indiqué. Si vous effectuez des jointures sur plusieurs colonnes, les colonnes correspondantes doivent être dans le même ordre dans rkey et dans lkey. Remarque La mise en correspondance des valeurs clés gauche et droite respecte la casse. Les valeurs correspondantes sont uniquement considérées comme identiques si leur casse est aussi identique. |
||||||||||||||||||
rcolumns = ["colonne_droite", "...n"] facultatif |
Les colonnes du cadre de données de droite à inclure dans le cadre de données de sortie joint. Les colonnes sont incluses dans l'ordre indiqué. Si vous omettez rcolumns, toutes les colonnes du cadre de données de droite sont incluses dans le cadre de données de sortie joint. Si vous souhaitez exclure toutes les colonnes de droite, indiquez rcolumns = []. rcolumns est ignoré si vous utilisez le type de jointure unmatched. Remarque La ou les colonnes rkey sont automatiquement incluses dans le cadre de données de sortie. Vous ne devez pas nécessairement les re-spécifier dans rcolumns. |
||||||||||||||||||
join_type = "inner" | "left" | "right" | "outer" | "unmatched" facultatif |
Type de jointure à effectuer. Si vous omettez join_type une jointure interne est effectuée par défaut.
|
Renvoie
Un cadre de données HCL.
Exemples
Joindre deux cadres de données pour détecter les employés susceptibles d'être aussi des fournisseurs
L'exemple ci-dessous joint le cadre de données (gauche) employees et le cadre de données (droite) vendors en utilisant l'adresse comme colonne clé commune (colonnes Adress et Vendor_Street).
La méthode join() crée un nouveau cadre de données avec les lignes de gauche et de droite correspondantes, ce qui génère la liste des employés et des fournisseurs ayant la même adresse.
employee_vendor_match = employees.join(other = vendors, lkey = ["Address"], lcolumns = ["Empno", "First", "Last"], rkey = ["Vendor_Street"], rcolumns = ["Vendor_No", "Vendor_Name"], join_type = "inner")
Joindre deux cadres de données pour découvrir des lignes de créances clients sans client qui correspond
L'exemple ci-dessous joint le cadre de données (de gauche) accounts_receivable et le cadre de données (de droite) customers à l'aide du Customer Number (CustNo) comme colonne clé commune.
La méthode join() utilise le type de jointure unmatched pour créer un nouveau cadre de données contenant des lignes gauches non correspondantes, qui aboutit à une liste de lignes accounts_receivable qui ne sont pas associées à une ligne customers.
customers_not_found = accounts_receivable.join(other = customers, lkey = ["CustNo"], lcolumns = ["Due", "Amount"], rkey = ["CustNo"], join_type = "unmatched")