データ結合方法の比較
Analytics で異なるデータ結合方法を使用する利点と問題点について、以下で説明します。
メモ
追加、抽出と追加、およびマージは比較されます。これは、これらの方法が同一または類似のレコード構造を持つテーブル同士を結合するからです。
結合は関連付けと比較します。これは、この 2 つの方法が異なるレコード構造を持つテーブル同士を結合するからです。
詳細については、データ構造およびデータ書式の要件を参照してください。
追加、抽出と追加、およびマージ
要件/機能 |
追加 |
抽出と追加 |
マージ |
---|---|---|---|
結合されるテーブルは同じデータ構造である必要があります。 | いいえ |
はい |
はい |
結果として生じる結合されたテーブルは並べ替えられています。 |
いいえ ソース テーブルから抽出されたレコードは、対象テーブルにグループとして追加されます。 |
いいえ ソース テーブルから抽出されたレコードは、グループとして、対象テーブルの最後に追加されます。 |
はい 両方のテーブルが並べ順に基づき、新しい 3 番目のテーブルに挿入されます。 |
2 つのテーブルを基とするデータにアクセスして分析する |
はい |
はい |
はい |
3 つ以上のテーブルを基とするデータにアクセスして分析する |
はい |
単一の抽出および追加操作ではサポートされていません。複数の操作が必要となります。 |
単一のマージ操作ではサポートされていません。複数の操作が必要となります。 |
物理的に別個の新規 Analytics テーブルに結果を出力する |
はい |
いいえ |
はい |
両方のテーブルのキー フィールドの要件:
|
適用不可 追加はキー フィールドを使用しません。 |
適用不可 抽出と追加はキー フィールドを使用しません。 |
はい |
キー フィールドの数 |
適用不可 追加はキー フィールドを使用しません。 |
適用不可 抽出と追加はキー フィールドを使用しません。 |
1 個以上のキー フィールドを各テーブルから選択できます。 |
結合と関連付け
メモ
結合したいテーブルが同じレコード構造をしている場合は、通常、追加、抽出/追加、またはマージを使用する必要があります。
機能の比較
機能 |
結合 |
関連付け |
---|---|---|
使用例 | 永久に結合された新しい 3 番目のテーブルを出力するため、調査作業の準備ステップに適しています。 | 永続化されるという要件のない仮想テーブルを作成するため、情報作業に適しています。 |
2 つのテーブルを基とするデータに同時にアクセスして分析する |
はい |
はい |
3 つ以上のテーブルを基とするデータに同時にアクセスして分析する |
いいえ 単一の結合操作ではサポートされていません。複数の結合操作が必要となります。 |
はい 単一の関連付け操作で、同時に最大 18 個までのテーブルのアクセス/分析をサポートしています。 |
物理的に別個の新規 Analytics テーブルに結果を出力する |
はい |
いいえ 必要であれば、別の操作を実行し、関連付けられたテーブル内にあるフィールドの任意の組み合わせを新しいテーブルに抽出することができます。 |
キー フィールドの数 |
1 個以上のキー フィールドを各テーブルから選択できます。 |
テーブルの組ごとに 1 つのキー フィールドに限定されます。 テーブルの組間の正確な関係を確立するために複数のキー フィールドが必要な場合は、必要なキー フィールドを連結するために、各テーブルに演算フィールドを作成します。 |
操作の実行速度 |
遅い 結合操作の期間は、結合の複雑さと、主テーブルが並べ替えられているかどうかによって変化します。 |
速い 実際のレコードの照合は、関連付けの操作中には行われません。このため、実行期間は結合よりもかなり短くなります。 |
ファイルの後続の処理 |
速い 結合の結果は、フラット ファイル(.fil ソース データ ファイル)に格納されます。フラット ファイルは非常に速く処理できます。 |
遅い 関連テーブル間のレコードの照合は後続の処理時に行われるため、処理時間が増えます。 |
ソース データ ファイルからの更新 |
いいえ 結合の結果は、新しいソース データ ファイルに含まれる新しい第 3 のテーブルへ出力され、結合にかかわったソース データ ファイルとの関連付けはなくなります。 |
はい 関連テーブルは関連付けられたままで、関係にかかわるソース データ ファイルから更新することができます。 |
一致した主レコードおよび副レコード (一致する 1 件目の副レコード) |
はい |
直接はサポートされていません テーブルを関連付けした後、フィルターを使用して、一致する副レコードがある主レコードを分離します。 |
一致した主レコードおよび副レコード (重複する副レコードのすべての一致) 多対多一致とも呼ばれます |
はい |
いいえ |
不一致の主レコード |
はい |
直接はサポートされていません テーブルを関連付けした後、フィルターを使用して、一致する副レコードがない主レコードを分離します。 |
すべての主レコードおよび一致した副レコード |
はい |
はい |
すべての副レコードおよび一致した主レコード |
はい |
いいえ |
すべての主レコードおよび副レコード(一致および不一致) |
はい |
いいえ |
要件の比較
要件 |
結合 |
関連付け |
---|---|---|
結合されるテーブルは同じデータ構造である必要があります。 | いいえ | いいえ |
キー フィールドのデータ型は、テーブルの組ごとで同じでなければならない |
変わる 文字 - 数値、または数値 - 文字の結合では必要ありません。Analytics によって自動的に調整されます。その他すべての可能性では必須です。 |
はい |
キー フィールドの長さは、テーブルの組ごとで同じでなければならない |
推奨(強制されません) 2 つの文字キー フィールドの長さは、Analytics によって自動的に調整されます。 |
推奨(強制されません) |
処理に必要なディスクの空き領域 |
多い 結合は、新しい第 3 のテーブルを作成します。このテーブルは、結合の性質によって、元の 2 つのテーブルを合わせたよりも大きくなることがあります。 |
少ない 子テーブルのインデックスを作成するための最低限のディスク空き容量が必要です。 |
テーブルは並べ替えられているか、インデックスが作成されている必要がある |
並べ替え、[あらかじめ並べ替える]、またはインデックスは、副テーブルでは必須、主テーブルでは任意です。 |
子テーブルではインデックスが必須(テーブルを関連付けるときに自動的に作成されます)で、親テーブルの並べ替えまたはインデックスは任意です。 |