连接到 Google BigQuery

概念信息

ACCESSDATA 命令

Google BigQuery 是云数据服务。您可以使用 Google BigQuery 数据连接器导入您的组织的 BigQuery 数据。

说明

Analytics 提供 Google BigQuery 作为可选的连接器,如果它在您的“数据访问”窗口中不可用,则可能是在安装过程中未选择该连接器。有关详细信息,请参见安装可选的 Analytics 数据连接器和 Python 引擎

开始之前

要连接到 Google BigQuery,您必须收集以下信息:

  • 认证详细信息
  • 目录

有关收集连接必备信息的帮助,请联系Google BigQuery您组织中的管理员。如果您的管理员不能帮助您,您或者您的管理员应该联系Google BigQuery支持人员。

创建 BigQuery 连接

  1. 从 Analytics 主菜单中选择导入 > 数据库和应用程序
  2. 新建连接选项卡中,在 ACL 连接器部分中,选择Google BigQuery

    提示

    您可以通过在过滤连接框中输入搜索字符串来过滤可用连接器的列表。连接器按字母顺序排列。

  3. 数据连接设置面板中,输入连接设置,然后在面板底部单击保存并连接

    您可以接受默认的连接名称,也可以输入一个新的名称。

Google BigQuery的连接被保存到现有连接选项卡。将来,您可以从已保存的连接重新连接到Google BigQuery

一旦连接被建立,“数据访问”窗口将打开到暂存区域,并且您可以开始导入数据。有关从Google BigQuery导入数据的帮助,请参见使用数据访问窗口

连接设置

基本设置

设置 描述 示例
OAuth 机制

指定要用来认证驱动程序的认证机制:

  • 用户认证 - 驱动程序作为用户通过 Google 用户账户进行认证。
  • 服务认证 - 驱动程序作为服务通过 Google 服务账户进行认证。

使用用户认证时,单击登录可访问 Google 登录页面。

用户认证
确认码 您从 Google 获取的、用于生成刷新令牌的代码。  
刷新令牌 您从 Google 获取的、用于授权访问 BigQuery 的刷新令牌。在您提供确认代码后,刷新令牌被自动生成。  
电子邮件 使用服务认证时,请提供服务账户电子邮件 ID。  
密钥文件路径 配置服务认证时,请将此选项设置为用来认证服务账户电子邮件地址的 .p 12 或 .json 密钥文件的完整路径。  
目录(项目) 您的 Google BigQuery 项目的名称。  

高级设置

设置 描述 示例
代理主机 要通过其路由 HTTP 流量的代理的主机名或 IP 地址。驱动程序可使用 HTTP、Windows (NTLM) 或 Kerberos 认证类型向 HTTP 代理进行认证。  
代理端口

运行代理服务器的 TCP 端口。

默认值是 80。

80
代理用户名

要用来向代理服务器进行认证的用户名。

 
代理密码 要用来向代理服务器进行认证的密码。  
每秒最大请求数(0=无限)

提供每秒可以进行的最大请求数。

要允许每秒进行任意数量的请求,请键入 0。

0
每个块的行数 驱动程序必须为每个数据请求获取的最大行数。 16384
默认字符串列长度 STRING 列中可以包含的最大字符数。 65536
大型结果集的数据集名称

要用来存储大型结果集的临时表的 BigQuery 数据集的 ID。

仅当您想要启用对大型结果集的支持时,才应该为此选项指定值。

仅当您选择允许大型结果集选项,才会启用此域。

_odbc_temp_tables
临时表到期时间(毫秒) 临时表过期前的时间(以秒为单位)。要将该表设置为永远不会过期,请指定值 0。 3600000
语言方言

指定驱动程序是使用标准 SQL 语法还是传统 BigQuery SQL 语法执行查询。

  • 已启用 - 标准 SQL 语法
  • 已禁用 - 传统 BigQuery SQL 语法
 
使用传统 SQL 启用 SQLPrepare 元数据(较慢) 指定是否要对此查询使用 BigQuery 的传统 SQL 方言。  
允许大型结果集 指定在使用传统 SQL 时是否要查询大于 128 MB 的结果。  

数据连接器更新

当您升级 Analytics 或机器人代理时,应该使用一个 Analytics 数据连接器(ACCESSDATA 命令)测试用于导入数据的脚本。

由第三方数据源或 ODBC 驱动程序供应商进行的更改可能要求更新一个或多个数据连接器。脚本化数据连接可能需要更新以便继续正确工作。

  • 重新运行导入更新连接的最轻松方式是使用 Analytics 升级版本中的数据访问窗口手动执行导入。从日志复制 ACCESSDATA 命令并使用它更新您的脚本。

    说明

    在连接到数据源并重新运行导入之前,请清除连接器缓存以冲刷现有的表名称集。

    在数据访问窗口的现有连接选项卡中,在连接器名称旁边选择 > 清除缓存

  • 更新域规范您还可能需要更新脚本主体中的域规范以匹配数据源或 ODBC 驱动程序中的表架构更改。可能的更改包括域名称、域数据类型、域和记录长度。
  • 检查任何过滤的结果您还应该检查您在数据导入过程中应用的任何过滤的结果。您还应该检查您在数据导入过程中应用的任何过滤的结果。