Método join()

Combina columnas de dos marcos de datos en un único marco de datos, sobre la base de una clave común.

Sintaxis

nombre_marco_datos_izquierdo.join(other = nombre_marco_datos_derecho, lkey = ["columna_clave_izquierda", "...n"], lcolumns = ["columna_izquierda", "...n"], rkey = ["columna_clave_derecha", "...n"], rcolumns = ["columna_derecha", "...n"], join_type = "inner"|"left"|"right"|"outer"|"unmatched")

Parámetros

Nombre Descripción
other = right_dataframe_name El nombre del marco de datos derecho.
lkey = ["left_key_column", "...n"]

La o las columnas clave del marco de datos izquierdo.

Las columnas se usan en el orden en el que usted las indica. Si está realizando la unión por más de una columna, las columnas correspondientes deben estar en el mismo orden en lkey y rkey.

Nota

La coincidencia de los valores clave izquierdos y derechos distingue entre mayúsculas y minúsculas. Los valores coincidentes solo se consideran idénticos si el uso de mayúsculas y minúsculas también es idéntico.

lcolumns = ["columna_izquierda", "...n"]

opcional

Las columnas del marco de datos izquierdo que se deben incluir en el marco de datos de salida unido. Las columnas se incluyen en el orden en el que usted las indica.

Si omite lcolumns, se incluyen todas las columnas del marco de datos izquierdo en el marco de datos de salida unido.

Si desea excluir todas las columnas izquierdas, especifique lcolumns = [].

Nota

La o las columnas lkey se incluyen automáticamente en el marco de datos de salida. No necesita volver a especificarlas en lcolumns.

rkey = ["columna_clave_derecha", "...n"]

La o las columnas clave del marco de datos derecho.

Las columnas se usan en el orden en el que usted las indica. Si está realizando la unión por más de una columna, las columnas correspondientes deben estar en el mismo orden en rkey y lkey.

Nota

La coincidencia de los valores clave izquierdos y derechos distingue entre mayúsculas y minúsculas. Los valores coincidentes solo se consideran idénticos si el uso de mayúsculas y minúsculas también es idéntico.

rcolumns = ["columna_derecha", "...n"]

opcional

Las columnas del marco de datos derecho que se deben incluir en el marco de datos de salida unido. Las columnas se incluyen en el orden en el que usted las indica.

Si omite rcolumns, se incluyen todas las columnas del marco de datos derecho en el marco de datos de salida unido.

Si desea excluir todas las columnas derechas, especifique rcolumns = [].

rcolumns se ignora si utiliza el tipo de unión unmatched.

Nota

La o las columnas rkey se incluyen automáticamente en el marco de datos de salida. No necesita volver a especificarlas en rcolumns.

join_type = "inner" | "left" | "right" | "outer" | "unmatched"

opcional

El tipo de unión que se debe realizar.

Si omite join_type, se realiza una unión interna por valor predeterminado.

Tipo de unión El marco de datos de salida unido contiene lo siguiente:

"inner"

Todas las filas izquierdas coincidentes y todas las filas derechas coincidentes

Una fila para cada coincidencia entre los marcos de datos izquierdo y derecho

"left"

Todas las filas izquierdas (coincidentes y no coincidentes) y todas las filas derechas coincidentes

"right"

Todas las filas derechas (coincidentes y no coincidentes) y todas las filas izquierdas coincidentes

"outer"

Todas las filas izquierdas y derechas, coincidentes y no coincidentes

"unmatched"

Filas izquierdas no coincidentes

Devuelve

Marco de datos de HCL.

Ejemplos

Unir dos marcos de datos como una manera de descubrir empleados que también pueden ser proveedores

En el siguiente ejemplo, se unen el marco de datos employees (izquierdo) y el marco de datos vendors (derecho) usando el domicilio como la columna clave común (las columnas Address y Vendor_Street).

El método join() crea un nuevo marco de datos con las filas izquierda y derecha coincidentes, lo cual genera una lista de todos los empleados y proveedores que tienen el mismo domicilio.

employee_vendor_match = employees.join(other = vendors, lkey = ["Address"], lcolumns = ["Empno", "First", "Last"], rkey = ["Vendor_Street"], rcolumns = ["Vendor_No", "Vendor_Name"], join_type = "inner")

Unir dos marcos de datos como una manera de descubrir filas de cuentas por cobrar que no coinciden con ningún cliente

En el siguiente ejemplo, se unen el marco de datos accounts_receivable (izquierdo) y el marco de datos customers (derecho) utilizando el número de cliente (CustNo) como la columna clave común.

El método join() utiliza el tipo de unión unmatched para crear un nuevo marco de datos con las filas izquierdas sin coincidencia, lo cual genera una lista de filas accounts_receivable que no están asociadas a ninguna fila customers.

customers_not_found = accounts_receivable.join(other = customers, lkey = ["CustNo"], lcolumns = ["Due", "Amount"], rkey = ["CustNo"], join_type = "unmatched")