Google BigQuery への接続

コンセプト情報

ACCESSDATA コマンド

Google BigQuery はクラウド データ サービスです。Google BigQuery データ コネクターを使用して、BigQuery データをインポートできます。

メモ

Analytics は任意のコネクターとして Google BigQuery を提供します。データ アクセス ウィンドウでこのコネクターを使用できない場合、一般的に、インストール中にコネクターが選択されていないことが原因です。詳細については、任意の Analytics データ コネクター と Python エンジンをインスト-るするを参照してください。

作業を開始する前に

Google BigQuery に接続するには、以下を収集する必要があります。

  • 認証詳細
  • カタログ

接続の前提条件の収集については、組織の Google BigQuery 管理者に支援を仰いでください。管理者から支援を得られない場合は、あなたまたは管理者から Google BigQuery のサポートにお問い合わせください。

BigQuery 接続の作成

  1. Analytics のメイン メニューから、[インポート > データベースとアプリケーション]を選択します。
  2. ACL コネクター セクションの[新規の接続 ]タブから、Google BigQueryを選択します。

    ヒント

    使用可能なコネクターのリストをフィルタリングするには、[接続のフィルタリング]ボックスに検索文字列を入力します。コネクターはアルファベット順に表示されます。

  3. データ接続の設定]パネルが開いたら、接続設定を入力し、パネルの下部にある[保存して接続]をクリックします。

    デフォルトの接続名を使用するか、新しい接続名を入力します。

Google BigQueryの接続は、[既存の接続]タブに保存されます。今後、Google BigQueryに接続するには、保存したこの接続を使用できます。

接続が確立されると、データ アクセス ウィンドウが開いてステージング領域が表示されるので、データのインポートを開始できます。Google BigQueryからデータをインポートする方法については、データ アクセス ウィンドウの作業を参照してください。

接続設定

基本設定

設定 説明
OAuth 機構

ドライバーを認証する認証メカニズムを指定します。

  • ユーザー認証 - ドライバーは Google ユーザー アカウント経由でユーザーを認証します。
  • サービス認証 - ドライバーは Google サービス アカウント経由でサービスを認証します。

ユーザー認証]を使用するときには、[ログイン]をクリックして、[Google サインイン]ページを表示します。

ユーザー認証
確認コード リフレッシュ トークンを生成するために Google から取得するコード。  
リフレッシュ トークン BigQuery へのアクセスを承認するために Google から取得するリフレッシュ トークン。リフレッシュ トークンは、確認コードを入力した後に自動的に生成されます。  
電子メール サービス認証を使用するときには、サービス アカウントの電子メール ID を入力します。  
キー ファイルのパス サービス認証を構成するときには、このオプションを、サービス アカウント認証電子メール アドレスを認証するために使用される .p12 または .json 鍵ファイルへの完全パスに設定します。  
カタログ (プロジェクト) Google BigQuery プロジェクトの名前。  

詳細設定

設定 説明
プロキシのホスト HTTP トラフィックをルーティングするプロキシのホスト名または IP アドレス。ドライバーは、HTTP、Windows (NTLM)、または Kerberos 認証タイプを使用して、HTTP プロキシで認証できます。  
プロキシのポート

プロキシ サービスが実行されている TCP ポート。

デフォルト値は 80 です。

80
プロキシのユーザー名

プロキシ サーバーで認証するために使用されるユーザー名。

 
プロキシのパスワード プロキシ サーバーで認証するためのパスワード。  
1 秒あたりの最大要求数 (0=無制限)

1 秒あたりの最大要求数を指定します。

スロットリングなしで 1 秒あたりの要求数を無制限にするには、0 を入力します。

0
ブロックあたりの行数 各データ要求でドライバーが取得する必要がある最大行数。 16384
文字列型列のデフォルト長 STRING 列に含まれる最大文字数。 65536
大きな結果セットを収容するデータセット名

大きい結果セットの場合に一時テーブルに格納するために使用する BigQuery データセットの ID。

大きい結果セットのサポートを有効にする場合にのみ、このオプションの値を指定します。

大きい結果セットを許可]オプションを選択した場合にのみ、このフィールドが有効です。

_odbc_temp_tables
一時テーブルの有効期間 (ms) 一時テーブルが期限切れになるまでの時間(秒)。テーブルの有効期限を設定しない場合は、値 0 を指定します。 3600000
言語の方言

ドライバーがクエリを実行するときに、標準 SQL 構文を使用するか、レガシー BigQuery SQL 構文を使用するかを指定します。

  • 有効 - 標準 SQL 構文
  • 無効 - レガシー BigQuery SQL 構文
 
SQLPrepare メタデータとレガシー SQL を両方有効化 (低速) このクエリで BigQuery のレガシー SQL ダイアレクトを使用するかどうかを指定します。  
大きな結果セットを許可する レガシー SQL を使用するときに、28MB を超える結果をクエリするかどうかを指定します。  

データ コネクターの更新

Analytics またはロボット エージェントをアップグレードする場合は、いずれかの Analytics データ コネクターを使ってデータをインポートするスクリプト(ACCESSDATA コマンド)をテストする必要があります。

データ ソースまたは ODBC ドライバーのサード パーティ ベンダーが加えた変更により、1 つまたは複数のデータ コネクターを更新しなければならない可能性があります。スクリプトに作り込んだデータ接続を引き続き正常に動作させるには、それを更新する必要があります。

  • インポートの再実行 接続機能を最も簡単に更新する方法は、更新されたバージョンの Analytics のデータ アクセス ウィンドウを使って、インポートを手動で実行することです。ログに記録されている ACCESSDATA コマンドをコピーし、それを使ってスクリプトを更新します。

    メモ

    データ ソースに接続してインポートを再実行する前に、コネクターのキャッシュを消去することで、既存の一連のテーブル名を削除します。

    データ アクセス ウィンドウの[既存の接続]タブで、接続名の横にある[ >キャッシュの消去]を選択します。

  • フィールド指定の更新 データ ソースまたは ODBC ドライバーのテーブル スキーマの変更と一致するように、スクリプト本体内のフィールド指定を更新しなければならない場合もあります。必要に応じてフィールド名、フィールドのデータ型、およびフィールド長とレコード長を変更します。
  • フィルター処理の結果の確認 データ インポートの一環として適用したフィルター処理の結果も確認する必要があります。インポートのフィルター処理によってレコードを正しく追加または除外できたかどうかを確認します。