データの結合

Analytics では、一度に 1 つのテーブルのデータしか分析できません。このため、分析を実行する前に、2 つ以上のテーブルからデータを結合して、1 つのテーブルに入れる必要があります。

Analytics では、データを結合するために次の方法が提供されています。

レコードの結合	フィールドの結合
最後に追加抽出/最後に追加マージ	結合関連付け

ソースデータまたは分析目標の本質は、使用するデータ結合方法を規定します。以下に、5 つの方法の概要を示します。

最後に追加

2 つ以上のテーブルを追加すると、それらのテーブル内のレコードが結合されて新しいテーブルに出力されます。追加されるテーブル内の全フィールドを追加するか、または共通フィールドのみを追加するかを選択できます。

例

シナリオ

1 年全体に相当するデータに対して分析を実行したいが、データが 12 の月間取引テーブルに分散している場合を考えます。

アプローチ

12 の月間テーブルのデータを、それらのすべてを含む単一の年間テーブルに追加し、その後に分析を実行します。

詳細な情報

詳細については、テーブルの追加を参照してください。

抽出/最後に追加

データを抽出または追加するときに、1 つのテーブルからレコードを抽出し、別のテーブルの末尾にそれらを追加することができます。抽出はコピーと同じです。末尾に追加は追加と同じです。

レコード全体でなく、レコード内のフィールドのサブセットを抽出することもできます。

（対象テーブル）に追加するテーブルのサイズは大きくなります。新しいテーブルは作成されません。

例

シナリオ

従業員レコードのセット全体に対して分析を実行したいが、新しい従業員のレコードがまだ従業員マスターテーブルに含まれていない場合を考えます。

アプローチ

新しい従業員のレコードを抽出し、それらを従業員マスターテーブルの最後に追加して、分析を実行します。

詳細な情報

詳細については、データの抽出と追加を参照してください。

マージ

テーブルをマージするときには、2 つの並べ替えられたテーブルのレコードを、並べ替えられた新しい 3 番目のテーブルに挿入します。挿入は、既存の並べ順に従って、レコードを結合することを意味します。

例

シナリオ

従業員レコードのセット全体に対して分析を実行したいが、レコードが 2 つの課員テーブルに分散している場合を考えます。

どちらのテーブルもラストネームで並べ替えられているため、レコードを結合後に再度並べ替えるオーバーヘッドが生じないようにしたいとします。

アプローチ

2 つのテーブルにあるレコードを、新しい第 3 のテーブルに結合します。マージを行うことで、ラストネームでの並べ替えが保持されます。

詳細な情報

詳細については、テーブルのマージを参照してください。

結合

テーブルを結合するときには、共通キーフィールドを使用して、2 つのテーブルのレコードまたは選択したレコードを新しい 3 番目のテーブルに取り込みます。共通キーフィールドは、結合される両方のテーブルに現れる従業員 ID などの識別フィールドです。

例

シナリオ

考えられる不適切な報酬のデータを分析する方法の 1 つとして、従業員でもある業者を特定する必要があります。

アプローチ

業者マスターテーブルを従業員テーブルと結合し、共通キーフィールドの住所を使用します。

結合された出力テーブルには、同じ住所の業者と従業員が含まれます。

詳細な情報

詳細については、テーブルの結合を参照してください。

どのデータ結合方法を使用すべきですか。

データの結合方法を選択するときには、複数の考慮事項があります。最初は以下のガイドラインを使用できます。

使用...	条件...
最後に追加	複数のテーブルを最小の労力で結合したいとします。ソーステーブルのレコードは、構造が似ているか、またはまったく同じです。
抽出/最後に追加	2 つのソーステーブルのテーブルのレコードまたはフィールドは、構造がまったく同じです。
マージ	2 つのソーステーブルのテーブルのレコードは、構造がまったく同じです。両方のソーステーブルは同じ並べ替え順序を使用して並べ替えられます。ヒントマージを正常に実行するには、特別な方法があります。追加してから並べ替える、あるいは抽出または追加してから並べ替えるのでも、同じ結果を得ることができます。 2 つのソーステーブルが既に並べ替えられている場合は、マージはより効率的で、より迅速に実行できます。
結合	2 つのソーステーブルのレコードには異なるレコード構造があります。共通キーフィールド内の一致する、または一致しない値に基づいて、レコードを包含または除外する必要があります。物理的な結合テーブルが必要な調査分析を行っています。
関連付け	異なるレコード構造の最大 18 テーブルを関連付け（実際には結合）しようとしています。共通キーフィールド内の一致する、または一致しない値に基づいて、レコードを包含または除外する必要があります。結合されたデータを、新しいテーブルに出力する必要がありません。レポートのように、テーブル間の一時的な関連付けのみが必要な情報作業を実施しています。ヒント必要であれば、テーブルの関連付けの後、別の操作を実行し、関連付けられたテーブル内にあるフィールドの任意の組み合わせを新しい物理テーブルに抽出することができます。

データ構造

データを結合するときにどの方法を選択するかは、そのソースデータの構造によって大きく左右されます。データ構造（レコード構造）は、レコードに含まれるデータ要素、データ型、フィールドの長さ、および列数と並べ順を示します。

データ構造の詳細については、データ構造およびデータ書式の要件を参照してください。

実験が必要な場合があります

状況によっては、データを結合するためにどの方法を用いれば良いかがすぐには明らかにならないことがあります。実行したいタスクに最も適した方法を決定するために、データの小さなサブセットを使って試してみる必要があるかもしれません。

小さなサブセットを使用すると、大きなテーブルの処理に伴う長い処理時間を回避できるほか、パターンが調べやすくなる可能性もあります。

目的を達成するために、2 つ以上のデータの結合方法を使用することができます。

1 つのデータ結合方法を最初に使用してから、最初の方法の出力結果で 2 番目の方法を使用し、複数のテーブルを含む、より複雑なデータ結合の状況に対処できる場合があります。

例

最初に、月次取引テーブルを結合し、年次取引テーブルを作成します。
顧客 ID などの共通キーフィールドを使用して、年次取引テーブルを、顧客名などのデータを含むマスターテーブルに結合します。

データの結合

最後に追加

例

詳細な情報

抽出/最後に追加

例

詳細な情報

マージ

例

詳細な情報

結合

例

詳細な情報

関連付け

例

詳細な情報

どのデータ結合方法を使用すべきですか。

データ構造

実験が必要な場合があります

目的を達成するために、2 つ以上のデータの結合方法を使用することができます。

例

Page options

Is this page helpful?

Is this page helpful?