append() 方法

通过将一个数据帧附加到另一数据帧的底部,将两个或更多个数据帧中的行组合到单个数据帧中。

语法

dataframe_1_name.append([dataframe_2_name, dataframe_3_name, ...n], common_columns_only = True|False, all_chars = True|False)

参数

名称 描述
数据帧 2 名称, 数据帧 3 名称, ...n

要附加的一个或多个数据帧的名称。

数据帧被按照您指定它们的顺序附加。 输出数据帧首先包含数据帧 1 中的列,然后包含数据帧 2 中的列,依此类推。

源数据帧可以具有不同或者相同的列。

common_columns_only = True | False
  • True 只有所附加的所有数据帧共有的列才会被包括在输出数据帧中。

    如果数据帧列具有完全相同的名称,则会被视为共有。

  • False 所有数据帧中的所有列都被包括在输出数据帧中。 输出数据帧中不存在相应源数据帧列的位置会显示NaN 值。
all_chars = True | False
  • True 将所附加的所有数据帧中的所有非字符列转换为字符串数据类型。

    这一向字符串数据的全局转换可确保所有同名列都被没有错误地附加。

  • False 所附加的数据帧中的非字符列的数据类型保持不变。

返回

HCL 数据帧。

示例

附加具有相同数据结构的数据帧

您将 Trans_JanTrans_FebTrans_Mar 数据帧附加到单个名为 Trans_Q1 的数据帧中,它包括三个源数据帧中的所有行。

源数据帧全都具有相同的列集,因此,您为 common_columns_only 指定 True 还是 False 没有关系。

Trans_Q1 = Trans_Jan.append([Trans_Feb, Trans_Mar], common_columns_only = False, all_chars = False)

附加具有不同数据结构的数据帧

您具有多个分别包含公司不同部门员工数据的数据帧。 您需要将所有员工数据集成到单个数据帧中,以便执行某种分析。 在所有数据帧中,大多数列是相同的,但您的分析所不需要的某些列为个别数据帧所独有。

您使用 common_columns_only 指定只有在所有数据帧中都相同的列才被包括在输出数据帧中。 如果某个列在任何数据帧中都不存在,则它被从输出中省略。

Employees_All = Employees_HQ.append([Employees_West, Employees_South], common_columns_only = True, all_chars = False)