数据组合方法的比较

下面概述了 Analytics 中的不同数据组合方法的优点和缺点。

说明

附加、提取并附加以及合并得到比较,因为这些方法将表与相同或类似的记录结构相组合。

联接与关联进行比较,因为这两种方法采用不同的记录结构组合表。

有关详细信息,请参见数据结构和数据格式要求

附加、提取并附加以及合并

要求/功能

附加

提取并附加

合并

要组合的表必须具有完全相同的数据结构

生成的组合表已排序

从源表提取的记录被成组附加到输出表中。

从源表提取的记录被整体附加到目标表的末尾。

来自这两个表的记录被基于排序顺序插入到新的第三个表中。

访问和分析两个表中的数据

访问和分析两个以上的表中的数据

单个提取并附加操作不支持。需要多个操作。

单个合并操作不支持。需要多个操作。

将结果输出到新的、物理上独立的 Analytics 表

这两个表中的键域必须:

  • 已排序
  • 具有相同的数据类型
  • 具有相同的长度

不适用

附加操作不使用键域。

不适用

提取并附加操作不使用键域。

关键字域数量

不适用

附加操作不使用键域。

不适用

提取并附加操作不使用键域。

可以从每个表选择一个或多个关键字域。

联接和关联

说明

如果您要组合的表具有相同的记录结构,您可能应该使用附加、提取并附加或合并。

功能比较

功能

联接

关联

用例 适合作为调查性工作的预备步骤,因为它会输出新的永久联接的第三个表。 对于信息性工作是适合的,因为它会创建一个无需永久存在的虚拟表。

同时从两个表访问和分析数据

同时从两个以上的表访问和分析数据

不支持通过单个联结操作。要求多个联结操作。

单个关联操作支持对最多 18 个表同时进行访问/分析。

将结果输出到新的、物理上独立的 Analytics 表

如果需要,可执行单独的操作,从表中将任何域组合提取到新的表格中。

关键字域数量

可以从每个表选择一个或多个关键字域。

每个表对限制为一个关键字域

如果建立一个表对之间的精确关联要求多个关键字域,在每个表中创建一个计算域串联要求的关键字域。

操作的执行速度

较慢

联结操作的持续时间长短取决于联结的复杂程度以及是否对主表进行排序。

较快

关联操作期间并不进行实际的记录匹配。因此,关联比联结花的时间要少很多。

文件的随后处理

较快

联结的结果会存放在一个平构文件中(.fil 源数据文件)。处理平构文件速度很快。

较慢

随后的处理过程中,在关联表之间进行记录匹配,会增加处理时间。

可从源数据文件更新

联结结果被发送到新的第三表,新的源数据文件不再与联结中涉及的源数据文件相关。

相关表会保持关联,可以从关联涉及的源数据文件更新。

匹配的主记录和辅助记录

(第一个辅助匹配)

不直接支持

关联表之后,使用过滤器分开有匹配辅助记录的主记录。

匹配的主记录和辅助记录

(所有辅助匹配)

也叫做多对多匹配

不匹配的主记录

不直接支持

关联表之后,使用过滤器分开没有匹配辅助记录的主记录。

所有主记录和匹配的辅助记录

所有辅助记录和匹配的主记录

所有主记录和辅助记录,包括匹配的和不匹配的

要求比较

要求

联接

关联

要组合的表必须具有完全相同的数据结构

每个表对的关键字域数据类型必须相同

有所不同

字符-数值或数值-字符连接无此要求。由 Analytics 自动统一。所有其他可能性都有此要求。

每个表对的关键字域长度必须相同

建议(非强制)

Analytics 自动统一两个字符键域的长度。

建议(非强制)

处理时所需的磁盘空间

更多

联结操作会新创建第三个表,取决于联结的情况,会比组合的原始表要大。

较少

创建子表索引所要求的磁盘空间很小。

必须对表进行排序或索引

要求对辅助表进行排序、预排序或索引,但对主表不作要求,仅供选择。

要求对子表进行索引(在关联表时自动创建索引),对主表可选择是排序还是索引。