条件付きサンプリング

注意

サンプル時にコマンド フィルタリングまたは範囲パラメーターを適用すると、サンプルの有効性が損なわれます。 これを行う場合は、サンプルの結果が無効になる可能性があるという注記がログに生成されます。

サンプル]ダイアログ ボックスでは、コマンド フィルターや範囲パラメーターを適用できるオプションがありますが、本ガイドではサンプリング手順にこれらの手順を含めていません。

条件付きサンプリングは、特定の場所で発生する取引、特定の製造元で製造された製品など、指定された条件を満たすレコードにサンプル選択を制限するために使用されます。

条件付きサンプリングを実行する場合は、必ず正確なデータ セットで作業する必要があります。 サンプル時にコマンド フィルターを使用してデータを絞り込むと、予期しない結果が生成される可能性があります。 最初に、任意の条件を満たすデータを新しいテーブルに抽出してから、フィルターを使用せずに、新しいテーブルでサンプリングを実行することをお勧めします。

フィルタリングされたデータのサンプリングと、サンプリングされたデータのフィルタリング

条件付きサンプリングを実行するときには、次の差異に注意してください。

  • フィルタリングされたデータのサンプリング
  • サンプリングされたデータのフィルタリング

ベスト プラクティス:フィルタリングされたデータのサンプリング

1000 件のレコード中 150 件が条件 “Dept 03” を満たすテーブルを考えてください。 “Dept 03” から 10 レコードのサンプルを抽出するとします。

最善の方法は “Dept 03” レコードをフィルタリングし、新しいテーブルに先に抽出してから、サンプルを抽出します。 次に新しいテーブルをサンプリングし、“Dept 03” レコードのみから抽出します。 この方法を使用すると、フィルタリングされたデータをサンプリングします。

回避する方法:サンプリングされたデータのフィルタリング

1000 件のレコード中 150 件が条件 “Dept 03” を満たすテーブルを考えてください。 “Dept 03” から 10 レコードのサンプルを抽出するとします。

1000 レコードある元のテーブルから 10 レコードのサンプルを抽出し、処理でコマンド フィルター IF Dept = "03" を適用する場合は、サンプリングされたデータをフィルタリングします。

この方法の問題は、まずフィルターリングされていないデータ セットから 10 件のレコードが選択されます。その中から "Dept 03" に一致するレコードが選択されるので、サンプルに必要なレコード数が 10 件よりも少なくなってしまいます。 サンプルが代表的ではなく、無効です。

同様の理由から、サンプリングされたレコードを含む出力テーブルに対しフィルターリングした場合もサンプルが無効になります。