CVSSAMPLE コマンド
従来の変数サンプリング方法を使用して、レコードのサンプルを抽出します。
構文
CVSSAMPLE ON 簿価フィールド NUMSTRATA 数値 <SEED シード値> CUTOFF 値 <BCUTOFF 値> STRATA 境界値 <,...n> SAMPLESIZE 数値 <,...n> POPULATION 層カウント,層値 <,...n> <IF テスト> TO テーブル名
パラメーター
メモ
CVSPREPARE コマンドの出力結果を CVSSAMPLE コマンドの入力として使用している場合は、多数のパラメーター値が既に指定され、変数に格納されています。 詳細については、CVSPREPARE コマンドを参照してください。
値を指定する際、3 桁の区切り記号やパーセント記号は含めないでください。
名前 | 説明 |
---|---|
ON 簿価フィールド | サンプルの基準として使用する数値簿価フィールド。 |
NUMSTRATA 数値 | 簿価フィールドを階層化するために使用する層の数。 |
SEED シード値 省略可能 |
Analytics の乱数ジェネレーターを初期化するために使用するシード値。 SEED を省略した場合は、シード値がランダムに選択されます。 |
CUTOFF 値 |
上位確実性層のカットオフ値。 カットオフ値以上の簿価フィールドの金額が自動的に選択され、サンプルに取り込まれます。 |
BCUTOFF 値 省略可能 |
下位確実性層のカットオフ値。 カットオフ値以上の簿価フィールドの金額が自動的に選択され、サンプルに取り込まれます。 |
STRATA 境界値 <,...n> | 簿価フィールドを階層化するために使用される上限の境界値 |
SAMPLESIZE 数値 <,...n> | 各層からサンプリングするレコード数。 |
POPULATION 層カウント, 層値 <,...n> | 各層のレコード数と各層の合計値。 |
IF テスト 省略可能 |
各レコードを処理するために真である必要がある条件式。 コマンドは、その条件を満たすレコードに対してのみ実行されます。 注意 条件式を指定する場合、サンプル サイズの計算時とサンプルの抽出時とで、同じ条件式を使用する必要があります。 一方の段階で使用した条件を他方の段階で使用しない場合、つまり 2 つの条件が同一でない場合、サンプリング結果が通常、統計的に無効になります。 |
TO テーブル名 |
コマンドの結果を送信する場所:
|
Analytics の出力変数
名前 | 含む |
---|---|
S_TOPEV |
ユーザーが指定する上位確実性層カットオフ値。何も指定しない場合は、CVSPREPARE コマンドで以前に計算された上位層の上限境界。 また、上位確実性層のレコード数とそれらのレコードの合計金額値も指定します。 |
SBOTTOMEV |
ユーザーが指定する下位確実性層カットオフ値。何も指定しない場合は、CVSPREPARE コマンドで以前に計算された下位層の下限境界。 また、下位確実性層と合計金額値のレコード数も指定します。 |
SBOUNDARYEV | コマンドによってあらかじめ入力、またはユーザーが指定したすべての層の上限の境界。 上位確実性層や下位確実性層は指定しません。 |
SPOPULATION | 各層のレコード数のカウントと合計値。 上位確実性層や下位確実性層は指定しません。 |
例
従来の変数サンプリングの抽出
従来の変数サンプリングを使用して、請求書を含む勘定の金額虚偽表示の合計金額を推定します。
母集団を階層化し、各層の統計的に有効なサンプル サイズを計算した後に、サンプルを抽出できます。
以下の例は、invoice_amount フィールドを基準にしてレコードの階層化サンプルを抽出し、その階層化されたレコードを Invoices_sample てテーブルに出力します。
CVSSAMPLE ON invoice_amount NUMSTRATA 5 SEED 12345 CUTOFF 35000.00 STRATA 4376.88,9248.74,16904.52,23864.32,35000.00 SAMPLESIZE 37,36,49,36,39 POPULATION 1279,3382131.93,898,5693215.11,763,9987014.57,627,12657163.59,479,13346354.63 TO "Invoices_sample"
備考
メモ
このコマンドの動作の詳細については、Analytics のヘルプを参照してください。
システム生成フィールド
Analytics により、自動的に 4 つのフィールドが生成され、サンプル出力テーブルに追加されます。 サンプルに追加される各レコードのフィールドには、以下の記述的情報が格納されます。
- STRATUM レコードが割り当てられる層の数
- ORIGIN_RECORD_NUMBER ソース データ テーブル内の元のレコード番号
- SELECTION_ORDER 各層においてレコードがランダムに選択された順序
- SAMPLE_RECORD_NUMBER サンプル出力テーブル内のレコード番号