データの結合

Analytics では、一度に 1 つのテーブルのデータしか分析できません。このため、分析を実行する前に、2 つ以上のテーブルからデータを結合して、1 つのテーブルに入れる必要があります。

Analytics では、データを結合するために次の方法が提供されています。

レコードの結合 フィールドの結合
  • 最後に追加
  • 抽出/最後に追加
  • マージ
  • 結合
  • 関連付け

ソース データまたは分析目標の本質は、使用するデータ結合方法を規定します。以下に、5 つの方法の概要を示します。

最後に追加

2 つ以上のテーブルを追加すると、それらのテーブル内のレコードが結合されて新しいテーブルに出力されます。追加されるテーブル内の全フィールドを追加するか、または共通フィールドのみを追加するかを選択できます。

シナリオ

1 年全体に相当するデータに対して分析を実行したいが、データが 12 の月間取引テーブルに分散している場合を考えます。

アプローチ

12 の月間テーブルのデータを、それらのすべてを含む単一の年間テーブルに追加し、その後に分析を実行します。

詳細な情報

詳細については、テーブルの追加を参照してください。

抽出/最後に追加

データを抽出または追加するときに、1 つのテーブルからレコードを抽出し、別のテーブルの末尾にそれらを追加することができます。抽出はコピーと同じです。末尾に追加は追加と同じです。

レコード全体でなく、レコード内のフィールドのサブセットを抽出することもできます。

(対象テーブル)に追加するテーブルのサイズは大きくなります。新しいテーブルは作成されません。

シナリオ

従業員レコードのセット全体に対して分析を実行したいが、新しい従業員のレコードがまだ従業員マスター テーブルに含まれていない場合を考えます。

アプローチ

新しい従業員のレコードを抽出し、それらを従業員マスター テーブルの最後に追加して、分析を実行します。

詳細な情報

詳細については、データの抽出と追加を参照してください。

マージ

テーブルをマージするときには、2 つの並べ替えられたテーブルのレコードを、並べ替えられた新しい 3 番目のテーブルに挿入します。挿入は、既存の並べ順に従って、レコードを結合することを意味します。

シナリオ

従業員レコードのセット全体に対して分析を実行したいが、レコードが 2 つの課員テーブルに分散している場合を考えます。

どちらのテーブルもラストネームで並べ替えられているため、レコードを結合後に再度並べ替えるオーバーヘッドが生じないようにしたいとします。

アプローチ

2 つのテーブルにあるレコードを、新しい第 3 のテーブルに結合します。マージを行うことで、ラストネームでの並べ替えが保持されます。

詳細な情報

詳細については、テーブルのマージを参照してください。

結合

テーブルを結合するときには、共通キー フィールドを使用して、2 つのテーブルのレコードまたは選択したレコードを新しい 3 番目のテーブルに取り込みます。共通キー フィールドは、結合される両方のテーブルに現れる従業員 ID などの識別フィールドです。

シナリオ

考えられる不適切な報酬のデータを分析する方法の 1 つとして、従業員でもある業者を特定する必要があります。

アプローチ

業者マスター テーブルを従業員テーブルと結合し、共通キー フィールドの住所を使用します。

結合された出力テーブルには、同じ住所の業者と従業員が含まれます。

詳細な情報

詳細については、テーブルの結合を参照してください。

関連付け

テーブルを関連付けるときには、最大 18 テーブルを結合します。共通キー フィールドを使用し、各テーブル ペアを関連付けます。

関連付け(実際には結合)は、テーブル間に一時的なプログラム関連付けを作成し、1 つの物理テーブルに存在するかのようにテーブルのデータにアクセスするようにできることです。ただし、物理テーブルは作成されません。いつでもソース テーブルの関連付けを解除できます。

共通キー フィールドは、関連付けられる各テーブル ペアに現れる従業員 ID などの識別フィールドです。一般的には、各テーブル ペアで異なる共通キー フィールドを使用します。

シナリオ

3 月の顧客と販売された製品に関する詳細を含む売上レポートを作成する必要がある場合に、データが 3 つのテーブルに分散しているとします。

アプローチ

顧客マスター テーブルを注文テーブルに関連付け、注文テーブルを製品マスター テーブルに関連付けて、レポートに必要なすべての情報を含むテーブルの一時的な関連付けを作成します。

  • 顧客マスター テーブル内の顧客名と顧客拠点
  • 注文テーブル内の注文詳細
  • 製品マスター テーブル内の製品詳細

詳細な情報

詳細については、テーブルの関連付けを参照してください。

どのデータ結合方法を使用すべきですか。

データの結合方法を選択するときには、複数の考慮事項があります。最初は以下のガイドラインを使用できます。

使用... 条件...
最後に追加
  • 複数のテーブルを最小の労力で結合したいとします。
  • ソース テーブルのレコードは、構造が似ているか、またはまったく同じです。
抽出/最後に追加
  • 2 つのソース テーブルのテーブルのレコードまたはフィールドは、構造がまったく同じです。
マージ
  • 2 つのソース テーブルのテーブルのレコードは、構造がまったく同じです。
  • 両方のソース テーブルは同じ並べ替え順序を使用して並べ替えられます。

ヒント

マージを正常に実行するには、特別な方法があります。追加してから並べ替える、あるいは抽出または追加してから並べ替えるのでも、同じ結果を得ることができます。

2 つのソース テーブルが既に並べ替えられている場合は、マージはより効率的で、より迅速に実行できます。

結合
  • 2 つのソース テーブルのレコードには異なるレコード構造があります。
  • 共通キー フィールド内の一致する、または一致しない値に基づいて、レコードを包含または除外する必要があります。
  • 物理的な結合テーブルが必要な調査分析を行っています。
関連付け
  • 異なるレコード構造の最大 18 テーブルを関連付け(実際には結合)しようとしています。
  • 共通キー フィールド内の一致する、または一致しない値に基づいて、レコードを包含または除外する必要があります。
  • 結合されたデータを、新しいテーブルに出力する必要がありません。
  • レポートのように、テーブル間の一時的な関連付けのみが必要な情報作業を実施しています。

ヒント

必要であれば、テーブルの関連付けの後、別の操作を実行し、関連付けられたテーブル内にあるフィールドの任意の組み合わせを新しい物理テーブルに抽出することができます。

データ構造

データを結合するときにどの方法を選択するかは、そのソースデータの構造によって大きく左右されます。データ構造(レコード構造)は、レコードに含まれるデータ要素、データ型、フィールドの長さ、および列数と並べ順を示します。

データ構造の詳細については、データ構造およびデータ書式の要件を参照してください。

実験が必要な場合があります

状況によっては、データを結合するためにどの方法を用いれば良いかがすぐには明らかにならないことがあります。実行したいタスクに最も適した方法を決定するために、データの小さなサブセットを使って試してみる必要があるかもしれません。

小さなサブセットを使用すると、大きなテーブルの処理に伴う長い処理時間を回避できるほか、パターンが調べやすくなる可能性もあります。

目的を達成するために、2 つ以上のデータの結合方法を使用することができます。

1 つのデータ結合方法を最初に使用してから、最初の方法の出力結果で 2 番目の方法を使用し、複数のテーブルを含む、より複雑なデータ結合の状況に対処できる場合があります。

  1. 最初に、月次取引テーブルを結合し、年次取引テーブルを作成します。
  2. 顧客 ID などの共通キー フィールドを使用して、年次取引テーブルを、顧客名などのデータを含むマスター テーブルに結合します。