使用数据访问窗口
概念信息
您可以使用数据访问窗口连接至数据库或文件中的源数据,以导入数据并创建一个 Analytics 表。
说明
如果连接失败,可使用两个日志文件来排除故障。有关详细信息,请参见数据访问日志文件。
在您连接到数据库或云数据服务之前
当使用“数据访问”窗口连接到数据库或者云数据服务时,存在某些要求或前提条件:
- 一个账户 您必须具有一个数据库或数据服务账户。该账户可能是个人账户或者与角色或您的公司相关联的账户。该账户完全独立于您的 Analytics 账户。
- 凭据 对于数据库或数据服务账户,您需要有效的凭据。所需的账户凭据的类型取决于数据源。您可能需要输入用户名和密码、访问令牌或者某种其他形式的凭据。
- 预先配置 对于 Salesforce 和 Concur 等数据源,在使用“数据访问”窗口连接之前,需要在云数据服务内进行预先配置。
说明
在云数据服务内配置连接前提条件的操作通常是由您的公司中负责管理该服务的人员执行的,例如,您的公司的 Salesforce 管理员或 Concur 管理员。
对于源自云数据服务的连接问题,您需要联系您的公司中该服务的管理员而不是“支持”。
连接到数据库或文件
从 Analytics 主菜单中选择导入 > 数据库和应用程序。
说明
在数据定义向导中,您还可以选择本地 > 数据库和应用程序。
使用现有连接
- 在现有连接选项卡中,选择您想要连接到的数据源的连接。
提示
您可以通过在过滤连接框中输入搜索字符串来过滤可用连接的列表。连接按字母顺序排列。
对于某些类型的连接,您会立即连接至源数据。
现有连接是在 ACL 连接器、ACL DSN 连接器(捆绑式)、Windows DSN 连接器和其他连接器下组织的。
如果您没有任何现有连接,则相关部分不会出现。
- 如果您没有立即连接,请执行以下操作之一:
- 如果数据连接设置面板打开,请单击面板底部的连接(您可能需要滚动屏幕)。
如果需要,您可以在单击连接之前更新连接设置。
- 如果文件选择对话框打开,请导航到适当的文件并选择它。
- 如果数据连接设置面板打开,请单击面板底部的连接(您可能需要滚动屏幕)。
创建新连接
- 选择新建连接选项卡。
- 选择您想要连接到的数据源的连接器。
提示
您可以通过在过滤连接框中输入搜索字符串来过滤可用连接器的列表。连接器按字母顺序排列。
可用的连接器是在 ACL 连接器、ACL DSN 连接器(捆绑式)、Windows DSN 连接器和其他连接器下组织的。
- 执行以下操作之一:
- 如果数据连接设置面板打开,请输入连接设置,单击该面板底部的保存并连接(您可能需要滚动屏幕)。
您可以接受默认的连接名称,也可以输入一个新的名称。
- 对于 ACL DSN 连接器(捆绑式)部分中的连接器,DSN 配置对话框将打开。
- 单击显示必需域选项卡。
- 为必需域提供值(如果有),然后单击测试连接。
出现您的数据源的登录页面。
- 提供连接详情并认证您的登录名。
- 在出现的连接成功对话框中单击确定。
- 在 DSN 配置对话框中,单击确定。
- 如果文件选择对话框打开,请导航到适当的文件并选择它。
说明
使用 Analytics 连接器建立的成功连接会被自动保存到现有连接选项卡。
使用 Windows 连接器完成的连接仅为当前数据导入会话保留。
- 如果数据连接设置面板打开,请输入连接设置,单击该面板底部的保存并连接(您可能需要滚动屏幕)。
管理数据连接
您可以重命名、复制或删除使用 ACL 连接器创建的连接。有关详细信息,请参阅管理数据连接。
将一个或多个表添加至暂存区域
- 请在“数据访问”窗口的架构下拉列表中,根据需要选择相应的数据库架构。
说明
某些数据源可能不具有架构,或者可能只有一个架构。
- 可选。在连接面板中,通过在搜索表框中输入一个搜索字符串来过滤可用表的列表。
字面量搜索字符串(不含通配符)的匹配项可能出现在表名称中的任意位置。该搜索不区分大小写。
您还可以在搜索字符串中使用一个或多个通配符。
显示更多通配符 范围 示例 匹配项 *
%
0 或更多个字符 invoice-j*
- Invoice-January
- Invoice-June
- Invoice-July
%june - Invoice-June
- PO-June
%invoice%
- Invoice-June
- June-Invoice
?
_
1 character invoice??
- invoice-1
- invoice-2
j_n
- Jan
- Jun
说明
如果您在搜索字符串中使用一个通配符,则匹配字符串的长度以及开始的和末尾的字符会被更严格地评估:
- j_n 仅匹配以 j 开头且以 n 结尾的三字符字符串
- j*n 匹配任何长度的字符串,但是这些字符串必须以 j 开头并且以 n 结尾
- 相比之下,jan 匹配任何长度的字符串,并且 jan 可能出现在字符串中的任意位置
此匹配行为是 Analytics 以下面的方式解释字面量搜索字符串(不含通配符)的结果:jan = *jan*
- 可选。滚动到表列表的底部,然后单击显示剩余 # 个表。
Analytics显示数据源中的前 200 个表。如果存在其他表,您可以单击显示剩余链接,以一次最多显示 500 个表的方式显示它们。
说明
搜索表框必须为空,该链接才能出现。
- 在可用表下,单击表名称以将该表添加至暂存区域。
表按字母顺序排列。如果您打算联接表,则最多可以向暂存区域添加十个表。SAP 连接器当前被限制到两个表。
说明
您不能使用一个导入操作分别导入多个表。必须首先联接表,才能将其一起导入。
- 可选。如果您想要向可用表的列表添加任何系统表,请选择包括系统表。
说明
此选项不适用于某些数据源。
联接表
如果您将一个以上的表添加到暂存区域,则需要联接这些表。
有关联接表的详细信息,请参见在数据访问窗口中联接表。有关联接 Apache Drill 表的信息,请参见联接来自 Apache Drill 数据源的表。
- 在暂存区域中,单击联接图标以访问联接设置。
- 单击所需的联接类型:
- 内层
- 外层
- 左侧
- 右
说明
某些数据连接器(包括 Microsoft Excel 和 Microsoft Access 连接器)不支持外层联接类型。
- 通过执行以下操作来选择通用关键字域:
- 在左列下,选择左表键域。
- 在右列下,选择右表键域。
提示
您可以通过在左列或右列框中输入搜索字符串来过滤可用域的列表。域按字母顺序排列。
- 可选。如果您需要添加附加键域,请单击 + 添加键。
- 单击应用以保存联接设置。
- 为您要联接的每个附加表创建联接设置。
- 可选。在导入预览面板中,单击刷新以查看联接表的预览。
选择要导入的域
默认情况下,除非您取消选择特定域,否则表中的所有域都会被导入。
- 如果您想要在导入操作中省略一个或多个域,请在该表上单击显示域下拉列表。
- 单击一个域名称以取消选择它。
提示
如果您想要取消选择大多数域,请单击全选切换按钮以取消选择所有域,然后重新选择所需的域。
- 在导入预览面板中,单击刷新以查看导入操作中包括的域。
- 可选。要将一个或多个域导入为加密哈希值:
- 在导入预览面板中,选择您想要转换的列顶部的哈希复选框。
- 在屏幕底部的加盐域中,输入要在哈希函数中使用的字母数字字符串。
盐值被限制为不超过 128 个字符。请勿使用下列任一字符:( ) "
如果您不提供盐值,则 Analytics 会生成一个随机字符串。单击刷新可查看加盐域中的生成字符串。
哈希值是单向转换,并且在您导入域之后无法解码。
说明
尽管您无法读取哈希数据的原始值,但在组合或者分析数据时,它仍然是有用的。如果您想要将导入过程中 ACCESSDATA 哈希值与使用 ACLScript 的 HASH( ) 函数哈希的值进行比较,您必须将任何 Analytics 数值域或日期时间域转换为字符值,并且在对数据进行哈希处理之前消除任何空格。
日期时间域必须使用下列格式:
- 日期时间 "YYYY-MM-DD hh:mm:ss"
- 日期 "YYYY-MM-DD"
- 时间 "hh:mm:ss"
过滤数据
默认情况下,除非您创建一个或多个过滤器以省略特定的记录,否则,表中的所有记录都会被导入。
说明
如果您同时使用下面解释的过滤选项,则首先应用条件性过滤,然后将指定数量的记录应用于条件性过滤的结果。
指定要导入的记录数
您可以指定仅导入特定数量的记录(从该表的顶部开始)。
- 在选择前 n 个记录中,输入您想要导入的记录数(从该表的顶部开始)。
- 可选。在导入预览面板中,单击刷新以查看导入操作中包括的记录。
提示
要将导入对象重置为该表中的所有记录,请在选择前 n 个记录中输入 n。
创建条件性过滤器
- 如果您想要在导入操作中条件性省略记录,请单击添加过滤器以限制结果来创建过滤器。
- 从域列表中,选择您想要用于过滤的域。
提示
您可以通过在域框中输入搜索字符串来过滤可用域的列表。域按字母顺序排列。
说明
如果您已经联接表,则可以从任一联接表中选择域。
- 从条件列表中,选择一个条件性运算符,如是、等于或大于。
属于运算符使您可以指定多个测试值。有关详细信息,请参见使用“属于”条件性运算符。
- 在第三个域中,输入要作为测试依据的值。
说明
如果您要使用逻辑域过滤,则测试值可能需要是下列值之一,具体取决于数据源:
- 'true' 或 'false'(包括单引号)
- 1 或 0(1= true,0 = false)
如果使用该域中的实际值之一过滤时返回错误,请尝试上述值之一。
- 可选。要添加其他过滤器,请执行以下操作:
- 单击添加过滤器。
- 选择 AND 或 OR,具体取决于您希望如何组合过滤器。
- 重复执行步骤 2 到 4 以创建过滤器。
您可以继续添加过滤器以指定您想要导入的精确数据集。
说明
当您在一个过滤器组中组合多个过滤器时,不能混合使用布尔型运算符。一个组中的所有过滤器都必须使用 AND 或 OR 组合。
- 可选。要添加过滤器组,请执行以下操作:
- 单击添加过滤器组。
- 选择 AND 或 OR,具体取决于您希望如何组合过滤器组。
- 重复执行步骤 2 到 4 以创建过滤器。
您可以继续向该过滤器组添加过滤器或者创建附加的过滤器组,以指定您想要导入的精确数据集。
说明
每个过滤器组中的过滤器被首先求值,然后,过滤器组被按照彼此之间的相互关系求值。
当您组合多个过滤器组时,不能混合使用布尔型运算符。所有过滤器组都必须使用 AND 或 OR 组合。
- 可选。在导入预览面板中,单击刷新以查看导入操作中包括的记录。
使用“属于”条件性运算符
属于运算符使您可以指定多个测试值。例如,您可以在 City 域上创建一个条件性过滤器,将您导入的记录范围限制为某些城市的记录:
New York、San Francisco、Dallas
下列规则适用于属于条件性运算符:
- 用逗号分隔测试值。测试值可以包含空格。(参见上面的示例。)
- 如果值包含一个或多个单引号 '
,请将测试值放在双引号 " "中。根据数据连接器的不同,您还可能需要将单引号字符转义。例如:"\'abc123\'"
- 如果值包含一个或多个双引号 ",请将测试值放在单引号 ' ' 中
- 如果值包含下列任一字符,请将测试值放在双引号 " " 或者单引号 ' ' 中:逗号 , 或者反斜杠 \
。反斜杠的后面必须跟至少一个字符。例如:"\a" 或 "\\"
- 在单个过滤器中,请勿同时使用双引号 " " 和单引号 ' ' 来环绕测试值。请仅使用其中一个方法。
调整最大域长度
如果所导入的字符域或备注域的默认最大域长度太短或太长,您可以调整它们。
超过最大字段长度的数据在被导入 Analytics 是会被截断。
说明
域长度不能分别指定。单个设置适用于导入操作中所有表中的所有字符域或备注域。
提示
请小心根据导入预览中的前几个值让域更短一些。在表的靠后位置可能出现较长的值。
- 在数据访问窗口的底部,增加或减少下列一个或两个域中的字符数:
- 字符域最大长度
- 备注域最大长度
- 在导入预览面板中,单击刷新以更新预览中的域长度。
说明
您可能需要拖动预览列以使其变宽,以便查看该列中的所有文本。
将所有域导入为字符数据
如果您想要将所有域导入为字符数据,请选择皆为字符。
将所有域导入为字符数据可以简化导入流程,并且使您可以将令人烦恼的域导入 Analytics 而不会丢失数据。一旦将数据导入 Analytics,您就可以向域分配不同的数据类型(如数值或日期时间),并且指定格式详细信息。
如果您所导入的表中的标识符域被 Analytics 自动分配“数值”数据类型,而实际上它们应该使用“字符”数据类型,则皆为字符选项很有用。
编辑 SQL 导入语句
如果您了解 SQL,则可以直接编辑 SQL 导入语句。
编辑 SQL 导入语句使您可以控制数据导入的各个无法通过用户界面控制的方面。例如,您可以更改 SQL 导入语句中的域名称。
注意
如果您返回到数据访问窗口中的可视化编辑器,则您在 SQL 模式中进行的任何更改都会丢失。
- 可选。单击 SQL 模式切换按钮。
- 编辑 SQL 导入语句。
说明
您不能在 SQL 导入语句的主体中使用 ACLScript 语法(命令或者函数)。您必须仅使用有效的 SQL 语法。
- 在导入预览区域,单击刷新以查看已更新的 SQL 对将被导入的数据的影响。
预览导入
在导入流程的任一阶段,您都可以预览导入,以查看联接、域选择、过滤和域长度调整的影响。
- 可选。在导入预览区域,如果您想要查看导入的记录数估计以及将要创建的 Analytics 数据文件 (.fil) 的大小,请选择估计大小。
警告
请小心使用估计大小选项。对于大型数据集和某些数据源而言,生成估计是处理器密集型操作,可能很缓慢。
- 在导入预览区域,单击刷新以查看将被导入的数据。
保存 Analytics 数据文件
当您指定所需的数据集后,请将导入的数据保存到 Analytics 数据文件。
- 在数据访问窗口的底部,单击保存。
- 指定 Analytics 表的名称,然后单击保存。
数据被导入,并且新表将自动在 Analytics 中打开。
说明
Analytics 表名称限制为 64 个字母数字字符,且不包括 .FIL 扩展名。该名称可以包括下划线字符 ( _ ),但不能包括其他特殊字符或任何空格。该名称不能以数字开头。
更新 Analytics 表和数据文件
您可以更新 Analytics 表和您使用“数据访问”窗口导入的关联数据文件。更新表会用最新的源数据刷新它。
准则
- 只有内容被刷新刷新 Analytics 表时只更新现有域的内容。它不会更新表布局。
如果源数据的结构已更改 – 例如,如果已经添加或移除了域,则不能刷新表。您必须重新导入数据。
- 表已打开如果该表在您刷新它时处于打开状态,则您暂时需要等于该表大小两倍的磁盘空间。如果您具有有限的磁盘空间,请首先将该表关闭,然后再刷新它。
- 使用 Analytics 12 导入的表使用 Analytics 版本 12 中的“数据访问”窗口导入的表不可刷新,即使您使用更高版本的 Analytics。
如果您想要能够刷新这些表,请使用 Analytics 12.5 或更高版本重新导入它们。
步骤
- 在导航器中,右键单击要更新的 Analytics 表,然后选择从源数据刷新。
- 在确认对话框中单击是。
- 如果出现密码提示窗口,请输入数据源的密码,然后单击确定。
说明
如果您想要使用不同账户来访问该数据源,则还可以更改用户名。
- 如果出现一个或多个提示窗口询问您是否想要保存更改,请单击是,除非您不想保存更改。
表会被刷新。