连接到 Twitter

概念信息

ACCESSDATA 命令

连接到 Twitter 中的实时数据并访问 Tweet、Follower、Message、Search 及其他内容。该连接器使用仅限应用的认证,因此您必须向 Twitter 注册一个应用并获取必要的凭据。

说明

您不能独立于 Analytics 使用此连接器。您可以使用 Windows ODBC 数据源管理器为连接器驱动程序配置一个 DSN,但是您必须从 Analytics 内部而不是从连接器的 Windows DSN 配置对话框中测试 DSN 连接。

开始之前

要连接到 Twitter,您必须使用 Twitter 应用管理门户注册一个应用并从 Twitter 获取 Oauth 凭据。

有关收集连接必备信息的帮助,请联系您组织中的 Twitter 管理员。如果您的管理员不能帮助您,您或者您的管理员应该联系Twitter支持人员。

创建 Twitter 连接

  1. 从 Analytics 主菜单中选择导入 > 数据库和应用程序Analytics。
  2. 新建连接选项卡中,在 ACL 连接器部分中,选择 Twitter

    提示

    您可以通过在过滤连接框中输入搜索字符串来过滤可用连接器的列表。连接器按字母顺序排列。

  3. 数据连接设置面板中,输入连接设置,然后在面板底部单击保存并连接

    您可以接受默认的连接名称,也可以输入一个新的名称。

Twitter的连接被保存到现有连接选项卡。将来,您可以从已保存的连接重新连接到Twitter

一旦连接被建立,“数据访问”窗口将打开到暂存区域,并且您可以开始导入数据。有关从Twitter导入数据的帮助,请参见使用数据访问窗口

连接设置

基本设置

设置 描述 示例
OAuth 客户端 ID

当您向 Twitter 的 OAuth 授权服务器注册您的应用时被分配的客户端 ID。

OAuth 要求您注册您的应用。在注册过程中,您将收到客户端 ID(有时也叫做使用者密钥)和客户端密钥。您必须同时指定 OAuthClientId 和 OAuthClientSecret 才能连接到 OAuth 服务器。

xvz1evFS4wEEPTGEFPHBog
OAuth 客户端秘钥

当您向 Twitter 的 OAuth 授权服务器注册您的应用时被分配的客户端密钥。

OAuth 要求您注册您的应用。在注册过程中,您将收到客户端 ID 和客户端密钥(有时也叫做使用者密钥)。您必须同时指定 OAuthClientId 和 OAuthClientSecret 才能连接到 OAuth 服务器。

L8qq9PZyRg6ieKGEKhZolGC0vJWLw8iEJ88DRdyOg
OAuth 访问令牌

使用 OAuth 连接时所用的访问令牌。

OAuthAccessToken 属性用来使用 OAuth 连接。OAuthAccessToken 是在认证过程中从 OAuth 服务器检索的。它具有一个依赖于服务器的超时,并且可在请求之间重用。

该访问令牌可取代您的用户名和密码。该访问令牌通过将您的凭据保存在服务器上来保护它们。

xvz1evFS4wEEPTGEFPHBog:L8qq9PZyRg6ieKGEKhZolGC0vJWLw8iEJ88DRdyOg
OAuth 访问令牌密钥

使用 OAuth 连接时所用的 OAuth 访问令牌密钥。

OAuthAccessTokenSecret 属性用来使用 OAuth 连接和认证。OAuthAccessTokenSecret 是在认证过程中从 OAuth 服务器检索的。它被与 OAuthAccessToken 结合使用,并且可被用于多个请求,直到它超时为止。

Ewy4p5VygSPOUI1rhbClVZcLnu05Y23Md22F0AKQYh1Hg

高级设置

设置 描述 示例
将日期时间转换为 GMT

在导入过程中将日期时间域转换至 GMT 时区。如果为假,则该日期时间值被转换为运行 Analytics 的计算机的操作系统时区。

密钥大小限制

主键列的最大长度。将大小设置为 0 会使键长度恢复到原始长度。

此属性使连接器覆盖所有主键列的报告长度。

255
映射到 Long Varchar

控制一个列是否被作为 SQL_LONGVARCHAR 返回。

使用此设置可映射任何大于指定大小的列,以便使它们被报告为 SQL_LONGVARCHAR 而不是 SQL_VARCHAR。

-1
映射到 WVarchar

控制字符串类型是否映射到 SQL_WVARCHAR 而不是 SQL_VARCHAR。它在默认情况下被设置。

必须将字符串列映射到 SQL_WVARCHAR 以适应各种国际字符集,因此 MapToWVarchar 默认情况下被设置为真。您可以将其设置为假以改而使用 SQL_VARCHAR。

伪列

指示是否将伪列作为列包括在表中。

此设置在 Entity Framework 中特别有用,它不允许您为伪列设置值,除非该列是表列。

此连接设置的值的格式为 "Table1=Column1, Table1=Column2, Table2=Column3"。您可以使用“*”字符包括所有表和所有列。

MyTable=*
大写标识符 请用大写报告所有标识符(包括表和列名称)。
SSL 服务器证书

要在使用 TLS/SSL 连接时从服务器接受的证书。您可以指定下列任一选项:

  • 完整的 PEM 证书
  • 包含证书的本地文件的路径
  • 公钥
  • MD5 指纹(还可以用空格或冒号分隔十六进制值)
  • SHA1 指纹(还可以用空格或冒号分隔十六进制值)

如果使用 TLS/SSL 连接,则此属性可被用来指定要从服务器接受的 TLS/SSL 证书。不被该计算机信任的任何其他证书都将被拒绝。

C:\cert.cer
支持增强的 SQL

通过启用内存客户端处理,增强 SQL 功能以超越可以通过 API 直接支持的功能:

  • 连接器将尽可能多的 SELECT 语句处理卸载到 IMAP,然后在内存中处理该查询的其余部分。这样,驱动程序就可以执行不受支持的谓词、联接和聚合
  • 连接器将 SQL 执行限制到 IMAP API 所支持的范围

谓词的执行

连接器确定哪些子句受到数据源的支持,然后将它们推送到数据源,以获取可满足查询的最小行超集。然后,它在本地过滤其余行。过滤器操作被简化,从而使驱动程序能够有效地对超大型数据集进行过滤。

联接的执行

连接器使用各种技巧在内存中联接。驱动程序以牺牲内存利用率为代价,避免了多次读取相同表。

聚合的执行

连接器检索在内存中处理聚合所需的所有行。

 
代理认证方案

用来向 ProxyServer 代理进行认证的认证类型。

此值指定用来向由 ProxyServer 和 ProxyPort 指定的 HTTP 代理进行认证的认证类型。

说明

连接器默认情况下将使用系统代理设置,而无需进一步的配置;如果您想要连接到另一代理,则除了设置 ProxyServer 和 ProxyPort 以外,您还需要将 ProxyAutoDetect 设置为假。要进行认证,请设置 ProxyAuthScheme,并且根据需要设置 ProxyUser 和 ProxyPassword。

认证类型可以是下列类型之一:

  • BASIC 驱动程序执行 HTTP BASIC 认证
  • DIGEST 驱动程序执行 HTTP DIGEST 认证。
  • NEGOTIATE 驱动程序基于适用于认证的协议检索 NTLM 或 Kerberos 令牌
  • PROPRIETARY 驱动程序不生成 NTLM 或 Kerberos 令牌。您必须在 HTTP 请求的授权标头中提供此令牌
BASIC
代理自动检测 指示是否使用系统代理设置。将 ProxyAutoDetect 设置为假可使用自定义代理设置。这将优先于其他代理设置。
代理用户

要用来向 ProxyServer 代理进行认证的用户名。

ProxyUser 和 ProxyPassword 选项被用来连接 ProxyServer 中指定的 HTTP 代理以及向其进行认证。

您可以在 ProxyAuthScheme 中选择可用的认证类型之一。如果您使用 HTTP 认证,请将此属性设置为 HTTP 代理所识别的用户的用户名。如果您使用 Windows 或 Kerberos 认证,请将此属性设置为采用下列格式之一的用户名:

  • 用户@域
  • 域\用户
john_doe@example.com
代理密码

要用来向 ProxyServer 代理进行认证的密码。

此属性被用来向支持 NTLM (Windows)、Kerberos 或 HTTP 认证的 HTTP 代理服务器进行认证。要指定 HTTP 代理,您可以设置 ProxyServer 和 ProxyPort。要指定认证类型,请设置 ProxyAuthScheme。

如果您使用 HTTP 认证,请另外将 ProxyUser 和 ProxyPassword 设置为 HTTP 代理。

如果您使用 NTLM 认证,请将 ProxyUser 和 ProxyPassword 设置为您的 Windows 密码。您还可能需要使用它们来完成 Kerberos 认证

 
代理服务器

要通过其路由 HTTP 流量的代理的主机名或 IP 地址。

要通过其路由 HTTP 流量的代理的主机名或 IP 地址。驱动程序可使用 HTTP、Windows (NTLM) 或 Kerberos 认证类型向 HTTP 代理进行认证。

默认情况下,驱动程序使用系统代理。如果您需要使用其他代理,请将 ProxyAutoDetect 设置为假。

206.174.193.115
代理端口 运行 ProxyServer 代理的 TCP 端口。 80
代理 SSL 类型

要在连接到 ProxyServer 代理时使用的 SSL 类型:

  • AUTO 如果 URL 是 HTTPS URL,则连接器将使用 TUNNEL 选项。如果 URL 是 HTTP URL,则连接器将使用 NEVER 选项(默认选项)
  • ALWAYS 连接始终支持 SSL
  • NEVER 连接不支持 SSL
  • TUNNEL 连接通过隧道代理完成:代理服务器打开到远程主机的连接,并且通过代理传输流量
AUTO

流表

避免查询持续捕捉已更新数据的表,如 TweetStream 表。流表不是历史数据的存档,并且只返回实时活动。这些表会创建保持打开状态的连接,从而可能导致您超过您的账户的 API 费率限额。

数据连接器更新

当您升级 Analytics 或机器人代理时,应该使用一个 Analytics 数据连接器(ACCESSDATA 命令)测试用于导入数据的脚本。

由第三方数据源或 ODBC 驱动程序供应商进行的更改可能要求更新一个或多个数据连接器。脚本化数据连接可能需要更新以便继续正确工作。

  • 重新运行导入更新连接的最轻松方式是使用 Analytics 升级版本中的数据访问窗口手动执行导入。从日志复制 ACCESSDATA 命令并使用它更新您的脚本。

    说明

    在连接到数据源并重新运行导入之前,请清除连接器缓存以冲刷现有的表名称集。

    在数据访问窗口的现有连接选项卡中,在连接器名称旁边选择 > 清除缓存

  • 更新域规范您还可能需要更新脚本主体中的域规范以匹配数据源或 ODBC 驱动程序中的表架构更改。可能的更改包括域名称、域数据类型、域和记录长度。
  • 检查任何过滤的结果您还应该检查您在数据导入过程中应用的任何过滤的结果。您还应该检查您在数据导入过程中应用的任何过滤的结果。

Twitter 数据连接器更改

下面列出了对 Twitter 数据连接器进行的具体更改。

Analytics 版本 更改

14.2

DirectMessagesSent 和 DirectMessagesReceived 表已被移除,并且被替换为新的 DirectMessages 表。

Tweets 表中的 IdLong 域的数据类型已被从 long 更改为字符串。