Google BigQuery への接続
コンセプト情報
Google BigQuery はクラウド データ サービスです。Google BigQuery データ コネクターを使用して、BigQuery データをインポートできます。
メモ
Analytics は任意のコネクターとして Google BigQuery を提供します。データ アクセス ウィンドウでこのコネクターを使用できない場合、一般的に、インストール中にコネクターが選択されていないことが原因です。詳細については、任意の Analytics データ コネクター と Python エンジンをインスト-るするを参照してください。
作業を開始する前に
Google BigQuery に接続するには、以下を収集する必要があります。
- 認証詳細
- カタログ
接続の前提条件の収集については、組織の Google BigQuery 管理者に支援を仰いでください。管理者から支援を得られない場合は、あなたまたは管理者から Google BigQuery のサポートにお問い合わせください。
BigQuery 接続の作成
- Analytics のメイン メニューから、[インポート > データベースとアプリケーション]を選択します。
- ACL コネクター セクションの[新規の接続 ]タブから、Google BigQueryを選択します。
ヒント
使用可能なコネクターのリストをフィルタリングするには、[接続のフィルタリング]ボックスに検索文字列を入力します。コネクターはアルファベット順に表示されます。
- [データ接続の設定]パネルが開いたら、接続設定を入力し、パネルの下部にある[保存して接続]をクリックします。
デフォルトの接続名を使用するか、新しい接続名を入力します。
Google BigQueryの接続は、[既存の接続]タブに保存されます。今後、Google BigQueryに接続するには、保存したこの接続を使用できます。
接続が確立されると、データ アクセス ウィンドウが開いてステージング領域が表示されるので、データのインポートを開始できます。Google BigQueryからデータをインポートする方法については、データ アクセス ウィンドウの作業を参照してください。
接続設定
基本設定
設定 | 説明 | 例 |
---|---|---|
OAuth 機構 |
ドライバーを認証する認証メカニズムを指定します。
[ユーザー認証]を使用するときには、[ログイン]をクリックして、[Google サインイン]ページを表示します。 |
ユーザー認証 |
確認コード | リフレッシュ トークンを生成するために Google から取得するコード。 | |
リフレッシュ トークン | BigQuery へのアクセスを承認するために Google から取得するリフレッシュ トークン。リフレッシュ トークンは、確認コードを入力した後に自動的に生成されます。 | |
電子メール | サービス認証を使用するときには、サービス アカウントの電子メール ID を入力します。 | |
キー ファイルのパス | サービス認証を構成するときには、このオプションを、サービス アカウント認証電子メール アドレスを認証するために使用される .p12 または .json 鍵ファイルへの完全パスに設定します。 | |
カタログ (プロジェクト) | Google BigQuery プロジェクトの名前。 |
詳細設定
設定 | 説明 | 例 |
---|---|---|
プロキシのホスト | HTTP トラフィックをルーティングするプロキシのホスト名または IP アドレス。ドライバーは、HTTP、Windows (NTLM)、または Kerberos 認証タイプを使用して、HTTP プロキシで認証できます。 | |
プロキシのポート |
プロキシ サービスが実行されている TCP ポート。 デフォルト値は 80 です。 |
80 |
プロキシのユーザー名 |
プロキシ サーバーで認証するために使用されるユーザー名。 |
|
プロキシのパスワード | プロキシ サーバーで認証するためのパスワード。 | |
1 秒あたりの最大要求数 (0=無制限) |
1 秒あたりの最大要求数を指定します。 スロットリングなしで 1 秒あたりの要求数を無制限にするには、0 を入力します。 |
0 |
ブロックあたりの行数 | 各データ要求でドライバーが取得する必要がある最大行数。 | 16384 |
文字列型列のデフォルト長 | STRING 列に含まれる最大文字数。 | 65536 |
大きな結果セットを収容するデータセット名 |
大きい結果セットの場合に一時テーブルに格納するために使用する BigQuery データセットの ID。 大きい結果セットのサポートを有効にする場合にのみ、このオプションの値を指定します。 [大きい結果セットを許可]オプションを選択した場合にのみ、このフィールドが有効です。 |
_odbc_temp_tables |
一時テーブルの有効期間 (ms) | 一時テーブルが期限切れになるまでの時間(秒)。テーブルの有効期限を設定しない場合は、値 0 を指定します。 | 3600000 |
言語の方言 |
ドライバーがクエリを実行するときに、標準 SQL 構文を使用するか、レガシー BigQuery SQL 構文を使用するかを指定します。
|
|
SQLPrepare メタデータとレガシー SQL を両方有効化 (低速) | このクエリで BigQuery のレガシー SQL ダイアレクトを使用するかどうかを指定します。 | |
大きな結果セットを許可する | レガシー SQL を使用するときに、28MB を超える結果をクエリするかどうかを指定します。 |
データ コネクターの更新
Analytics またはロボット エージェントをアップグレードする場合は、いずれかの Analytics データ コネクターを使ってデータをインポートするスクリプト(ACCESSDATA コマンド)をテストする必要があります。
データ ソースまたは ODBC ドライバーのサード パーティ ベンダーが加えた変更により、1 つまたは複数のデータ コネクターを更新しなければならない可能性があります。スクリプトに作り込んだデータ接続を引き続き正常に動作させるには、それを更新する必要があります。
- インポートの再実行 接続機能を最も簡単に更新する方法は、更新されたバージョンの Analytics のデータ アクセス ウィンドウを使って、インポートを手動で実行することです。ログに記録されている ACCESSDATA コマンドをコピーし、それを使ってスクリプトを更新します。
メモ
データ ソースに接続してインポートを再実行する前に、コネクターのキャッシュを消去することで、既存の一連のテーブル名を削除します。
データ アクセス ウィンドウの[既存の接続]タブで、接続名の横にある[
>キャッシュの消去]を選択します。
- フィールド指定の更新 データ ソースまたは ODBC ドライバーのテーブル スキーマの変更と一致するように、スクリプト本体内のフィールド指定を更新しなければならない場合もあります。必要に応じてフィールド名、フィールドのデータ型、およびフィールド長とレコード長を変更します。
- フィルター処理の結果の確認 データ インポートの一環として適用したフィルター処理の結果も確認する必要があります。インポートのフィルター処理によってレコードを正しく追加または除外できたかどうかを確認します。