提取数据
提取数据使您可以将记录或域的一些或全部从一个 Analytics 表复制到新的 Analytics 表。
新表可以是:
- 包含所有源表记录和域的相同副本
- 源表中的记录子集
- 源表中的域子集
- 源表中的记录和域子集
会在新表中保持源表中现有的排序。
说明
提取数据并将其附加到现有 Analytics 表的末尾是一项数据组合技术。在有关组合数据的部分中将解释该项技术。要了解更多信息,请参考提取并附加数据。
提取数据的效能
如下是提取数据至新表的一些原因:
- 只生成与特定分析有关的数据子集,从而降低文件大小和处理时间
- 使用过滤器可将特定项单独放到一个单独的表中以便进行进一步的分析
- 通过将原始数据文件的内容提取到文件的工作副本来保持其完整性
- 将计算域转换为用实际计算值填充的物理域
- 将数据从服务器表提取到一个新的本地表
- 将数据从两个或更多个相关表提取到一个新的 Analytics 表
提取数据和复制表之间的区别
在导航器( )中提取所有数据和复制一个表之间的差异是,提取数据会创建一个新的源数据文件 (.fil) 以及新表布局,而复制仅会创建一个与源表数据文件保持相关的新表布局。
按照记录、视图或域提取
当您提取数据时,您拥有以下选项:
- 记录提取整个记录
- 视图提取视图中的所有域
- 域提取选定的一组单个域
您提取全部记录时,会准确复制记录,包括表布局中未定义间隔中存储的任何数据。
您提取一个视图中的所有域、单个域,即使您提取源表中的所有域,也会忽略记录未定义的部分。
提取计算域
当您按记录提取时,计算域会保持为计算域。当您按视图或者按域提取时,它们被转换为适当数据类型的物理域,并用实际计算值填充。
提取计算域中的时间数据
如果计算域包含有 UTC 偏移的本地时间(例如, 23:59:59-05:00),则当您按记录提取时,本地时间和 UTC 偏移会被保留。
当您按视图或者按域提取时,本地时间和 UTC 偏移会被转换为没有偏移的 UTC。例如,23:59:59-05:00 变为 04:59:59。
与按照视图提取相关的其他详情
在提取对话框中选择视图选项使您可以准确提取当前显示在活动视图中的数据。
按照视图提取数据时,使用如下详细信息:
提取哪些域? |
仅提取视图中当前显示的域。不会提取属于表部分但未在视图中显示的任何其他域。 提取视图中的所有域。如果您要提取域的子集,从视图删除不要的域,仅创建有要求域的新视图,或者使用按照域提取而不是按照视图提取。 |
---|---|
域顺序 | 按照域在视图中出现的顺序提取域。如果您要以不同的顺序提取域,将它们在视图中重排或在提取之前按照希望的顺序利用域创建一个新的视图。 |
过滤 | 如果一个过滤器目前适用于视图,仅提取满足过滤器规则的数据。 |
记录说明 | 仅当记录说明列之前被添加到视图时才提取记录备注。 |
备用列标题 | 如果在视图级指定了任何替代的列标题,按照视图提取会保存视图级的标题。如果您在命令记录中使用了语法重新运行提取命令,会使用在表布局中指定的替代列标题,忽略视图级的主题。 |
脚本 命令行 |
脚本或命令行并不支持按照视图指定提取。在 ACLScript 中表达时,按视图提取实际上是使用活动视图中的所有域并按照它们出现在视图中的顺序按域进行提取 (EXTRACT FIELDS)。 |
提取逻辑域
提取逻辑域要求选择 将过滤器包含在域列表中 ( )。
设置控制汇总
如果您从表中提取所有记录、视图中的所有记录或者选择的域,您可以在数值域设置一个控制汇总以确认实际提取了所有数据。
在表布局对话框中为域设置控制总计。一旦您已经提取了数据,在新表中选择 以比较输入和输出控制汇总。要了解更多信息,请参考定义一个物理域。
从服务器表和本地表提取数据
您可以从服务器表和本地表提取数据。从服务器表提取的数据可以保存到服务器或者您本地计算机上。从本地表提取的数据只能保存到您本地计算机的表上。
步骤
可以从一个 Analytics 表提取部分或所有记录或域并将其输出到一个新的 Analytics 表。
说明
提取数据并将其附加到现有 Analytics 表的末尾是一项数据组合技术。在有关组合数据的部分中将解释该项技术。要了解更多信息,请参考提取并附加数据。
- 打开要提取记录或域的表。
- 选择 。
- 在主要选项卡上,选择下列选项之一:
- 记录提取整个记录
记录中的域被按照其出现在表布局中的顺序提取出来。
- 视图提取当前视图中的所有域
域被按照其出现在视图中的顺序提取出来。
- 域 提取一系列选定的单个域
域被按照您选择它们的顺序提取出来。
如果您要从表关联中的子表导出数据,选择域,如果子表域之间已被添加到视图,则选择视图。无法通过记录选项提取子表数据。
说明
如果要提取一或多个计算域,选择记录,可将提取的域保留为计算表达式。
选择视图或域将提取的域转换为适当数据类型的物理域,并使用实际计算的值填充它们。
- 记录提取整个记录
- 如果选择域,请执行以下操作之一:
从提取域列表中选择相应的域。
单击提取域,来选择相应的域或创建表达式,然后单击确定。
如果要从表关联的子表中选择域,请单击提取域。在选定域对话框的来自表下拉列表中,可以选择相应的子表。
-
如果当前视图中有想要从处理中排除的记录,请在如果文本框中输入一个条件,或单击如果使用表达式生成器创建 IF 声明。
说明
在应用任何范围选项(前、后、当)之后,仅针对表中的剩余记录评估如果条件。
- 执行以下操作之一:
在到文本框中,指定新 Analytics 表的名称。
单击到并指定新 Analytics 表的名称,或者在保存或文件另存为对话框中选择一个现有表以将其覆盖。
如果 Analytics 预填充了一个表名称,您可以接受预填充的名称或更改它。
您还可以指定一个绝对或相对路径,或导航到一个不同的文件夹,在与项目位置不同的位置处保存新表或覆盖现有表。例如:C:\结果\GL_2011.fil 或 结果\GL_2011.fil。无论将表保存或覆写到何处,打开项目时,如果项目中还没有此表,会将其添加到项目中。
- 如果还没有连接到服务器表,请执行以下操作之一:
- 选择 本地将输出表保存到与项目相同的位置,或者指定一个路径或导航到不同的本地文件夹。
- 使本地保持未选中状态,以便将输出表保存到服务器上的 Prefix 文件夹中。
说明
对于从 Analytics Exchange 服务器表的分析或处理中产生的输出结果,请选择本地。您不能取消选择本地设置以将结果表导入到 Analytics Exchange。
- 选择或取消选择使用输出表,具体取决于是否想让包含输出结果的 Analytics 表在操作完成后自动打开。
- 单击更多选项卡。
- 在范围面板中选择适当的选项:
- 全部–默认时选择该选项。使其保持选中状态可指定对视图中的所有记录进行处理。
- 前 –选择该选项,并在文本框中输入数量,则会在视图的第一条记录处开始处理,处理对象仅包括指定数量的记录。
- 后 –选择该选项,并在文本框中输入数量,则会在视图中当前选择的记录处开始处理,处理对象仅包括指定数量的记录。最左边列中的实际记录数量必须选中,并非行中的数据。
- 当 – 选择该选项可通过 WHILE 声明根据特定条件或条件组限制对视图中记录的处理。可以在当文本框中输入条件,或者单击当来使用表达式生成器创建 WHILE 声明。
只有当指定条件值为真时,WHILE 声明才允许对视图中的记录进行处理。当条件变为假时,处理立即终止,不再考虑剩余的记录。可将当选项与全部、前或后选项结合使用。在达到一个限制后,请立即记下处理步骤。
说明
前或后选项中指定的记录数参考表中记录的物理或索引顺序,不考虑对视图进行过滤或快速排序的情况。不过,解析操作的结果与任何过滤相关。
如果对视图进行了快速排序,则后的行为类似于前。
- 如有需要,可选择EOF(文件结尾处理),以到达表的末尾时,再强制执行一次提取操作。
当作为更大的分析过程的一部分,需要提取记录时,通常使用 EOF 参数,“提取”命令发生在脚本中的组内。如果基于序列记录之间的比较提取记录,可能需要使用 EOF,以确保表中的最后一个记录能被提取。
- 单击确定。
- 如果覆盖提示出现,请选择合适的选项。