Método join()
Combina columnas de dos marcos de datos en un único marco de datos, sobre la base de una clave común.
Sintaxis
nombre_marco_datos_izquierdo.join(other = nombre_marco_datos_derecho, lkey = ["columna_clave_izquierda", "...n"], lcolumns = ["columna_izquierda", "...n"], rkey = ["columna_clave_derecha", "...n"], rcolumns = ["columna_derecha", "...n"], join_type = "inner"|"left"|"right"|"outer"|"unmatched")
Parámetros
Nombre | Descripción | ||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
other = right_dataframe_name | El nombre del marco de datos derecho. | ||||||||||||||||||
lkey = ["left_key_column", "...n"] |
La o las columnas clave del marco de datos izquierdo. Las columnas se usan en el orden en el que usted las indica. Si está realizando la unión por más de una columna, las columnas correspondientes deben estar en el mismo orden en lkey y rkey. Nota La coincidencia de los valores clave izquierdos y derechos distingue entre mayúsculas y minúsculas. Los valores coincidentes solo se consideran idénticos si el uso de mayúsculas y minúsculas también es idéntico. |
||||||||||||||||||
lcolumns = ["columna_izquierda", "...n"] opcional |
Las columnas del marco de datos izquierdo que se deben incluir en el marco de datos de salida unido. Las columnas se incluyen en el orden en el que usted las indica. Si omite lcolumns, se incluyen todas las columnas del marco de datos izquierdo en el marco de datos de salida unido. Si desea excluir todas las columnas izquierdas, especifique lcolumns = []. Nota La o las columnas lkey se incluyen automáticamente en el marco de datos de salida. No necesita volver a especificarlas en lcolumns. |
||||||||||||||||||
rkey = ["columna_clave_derecha", "...n"] |
La o las columnas clave del marco de datos derecho. Las columnas se usan en el orden en el que usted las indica. Si está realizando la unión por más de una columna, las columnas correspondientes deben estar en el mismo orden en rkey y lkey. Nota La coincidencia de los valores clave izquierdos y derechos distingue entre mayúsculas y minúsculas. Los valores coincidentes solo se consideran idénticos si el uso de mayúsculas y minúsculas también es idéntico. |
||||||||||||||||||
rcolumns = ["columna_derecha", "...n"] opcional |
Las columnas del marco de datos derecho que se deben incluir en el marco de datos de salida unido. Las columnas se incluyen en el orden en el que usted las indica. Si omite rcolumns, se incluyen todas las columnas del marco de datos derecho en el marco de datos de salida unido. Si desea excluir todas las columnas derechas, especifique rcolumns = []. rcolumns se ignora si utiliza el tipo de unión unmatched. Nota La o las columnas rkey se incluyen automáticamente en el marco de datos de salida. No necesita volver a especificarlas en rcolumns. |
||||||||||||||||||
join_type = "inner" | "left" | "right" | "outer" | "unmatched" opcional |
El tipo de unión que se debe realizar. Si omite join_type, se realiza una unión interna por valor predeterminado.
|
Devuelve
Marco de datos de HCL.
Ejemplos
Unir dos marcos de datos como una manera de descubrir empleados que también pueden ser proveedores
En el siguiente ejemplo, se unen el marco de datos employees (izquierdo) y el marco de datos vendors (derecho) usando el domicilio como la columna clave común (las columnas Address y Vendor_Street).
El método join() crea un nuevo marco de datos con las filas izquierda y derecha coincidentes, lo cual genera una lista de todos los empleados y proveedores que tienen el mismo domicilio.
employee_vendor_match = employees.join(other = vendors, lkey = ["Address"], lcolumns = ["Empno", "First", "Last"], rkey = ["Vendor_Street"], rcolumns = ["Vendor_No", "Vendor_Name"], join_type = "inner")
Unir dos marcos de datos como una manera de descubrir filas de cuentas por cobrar que no coinciden con ningún cliente
En el siguiente ejemplo, se unen el marco de datos accounts_receivable (izquierdo) y el marco de datos customers (derecho) utilizando el número de cliente (CustNo) como la columna clave común.
El método join() utiliza el tipo de unión unmatched para crear un nuevo marco de datos con las filas izquierdas sin coincidencia, lo cual genera una lista de filas accounts_receivable que no están asociadas a ninguna fila customers.
customers_not_found = accounts_receivable.join(other = customers, lkey = ["CustNo"], lcolumns = ["Due", "Amount"], rkey = ["CustNo"], join_type = "unmatched")