SAMPLE コマンド
レコード サンプリングまたは金額単位サンプリング方法を使用して、レコードのサンプルを抽出します。
構文
メモ
フィルターリング(IF ステートメント)や範囲パラメーターを適用するとサンプルの妥当性を低下させてしまうため、それらのオプションはこの構文に含まれていません。
固定間隔選択方法
SAMPLE <ON> RECORD INTERVAL 間隔値 <FIXED 初期値> {RECORD|FIELDS フィールド名 <...n>} TO テーブル名 <LOCAL> <OPEN> <APPEND>
セル選択方法
SAMPLE <ON> RECORD CELL INTERVAL 間隔値 <RANDOM シード値> {RECORD|FIELDS フィールド名 <...n>} TO テーブル名 <LOCAL> <OPEN> <APPEND> <MERSENNE_TWISTER>
ランダム選択方法
SAMPLE <ON> RECORD NUMBER サンプルサイズ <RANDOM シード値> <ORDER> {RECORD|FIELDS フィールド名 <...n>} TO テーブル名 <LOCAL> <OPEN> <APPEND> <MERSENNE_TWISTER>
パラメーター
メモ
値を指定する際、3 桁の区切り記号は含めないでください。
名前 | 説明 |
---|---|
ON RECORD | レコード サンプリングを使用します。 |
INTERVAL 間隔値 FIXED 最初の値 | CELL INTERVAL 間隔値 | NUMBER サンプルサイズ |
INTERVAL 間隔値 FIXED 最初の値固定間隔選択方法を使用します。 最初のレコードを選択すると、そのレコードから固定した間隔、つまり固定した距離だけ離れたレコードが続いて選択されます。たとえば、最初に選択したレコードの後は、20 件に 1 件のレコードが選択されます。
CELL INTERVAL 間隔値セル選択方法を使用します。 データ セットが複数の均等なセルまたはグループに分割され、各セルから 1 つのレコードがランダムに選択されます。 各セルのサイズは間隔値によって指定します。 サンプル数の計算によって生成された間隔の値を入力します。 NUMBER サンプルサイズランダム選択方法を使用します。 すべてのレコードがデータセット全体からランダムに選択されます。 サンプル サイズの計算によって生成されたサンプル サイズを入力します。 |
RANDOM シード値 省略可能 |
メモ セルおよびランダム選択方法の場合のみ。 Analytics の乱数ジェネレーターを初期化するために使用するシード値。 ゼロ('0')の値を指定するか、または RANDOM を省略した場合は、シード値がランダムに選択されます。 |
ORDER 省略可能 |
メモ ランダム選択方法の場合のみ。 FIELDS を指定する場合には、ORDER のみを使用できます。 出力結果に ORDER フィールドを追加します。 このフィールドには、各レコードの選択順序がランダムであることが表示されます。 |
RECORD | FIELDS フィールド名 <...n> |
|
TO テーブル名 |
コマンドの結果を送信する場所:
|
LOCAL 省略可能 |
Analytics プロジェクトと同じ場所に出力ファイルを保存します。 メモ Analytics テーブルである出力ファイルを含むサーバー テーブルに対してコマンドを実行するときにのみ適用されます。 LOCAL パラメーターは TO パラメーターの直後に置く必要があります。 |
OPEN 省略可能 |
コマンドを実行した後、コマンドによって作成されたテーブルを開きます。 コマンドが出力テーブルを作成する場合にのみ有効です。 |
APPEND 省略可能 |
コマンドの出力を既存ファイルに上書きしないで、そのファイルの末尾に追加します。 メモ コマンドの出力と既存のファイルの構造が同一であるようにする必要があります。
出力は、既存ファイルとの間でファイル構造が違っている場合でも、Analytics によって既存ファイルに追加されます。 出力と既存のファイルの構造が一致しない場合は、データが混在、不足、不正確になります。 |
MERSENNE_TWISTER 省略可能 |
メモ セルおよびランダム選択方法の場合のみ。 Analytics の乱数ジェネレーターでは、メルセンヌ ツイスター アルゴリズムが使用されます。 このパラメーターを省略した場合は、Analytics のデフォルトのアルゴリズムが使用されます。 メモ バージョン 12 より前の Analytics で作成された Analytics スクリプトまたはサンプリングの結果との後方互換性が必要な場合は、単純にデフォルトの Analytics アルゴリズムを使用してください。 |
例
レコード サンプルの抽出
レコード サンプルを使用して、請求書を含む勘定の規定された統制からの逸脱率を推定します。
統計的に有効なサンプル サイズを計算した後、サンプルを抽出する準備ができています。 ランダム選択方法を使用します。
以下の例:
- 開いている Analytics テーブルからサンプルを抽出する
- シード値 123456 を指定してランダム選択方法を使用する
- サンプルサイズとして 95 レコードを指定する
- 指定したフィールドのみを出力テーブルに含める
- Analytics の乱数ジェネレーターでメルセンヌツイスター アルゴリズムを使用することを指定する
SAMPLE ON RECORD RANDOM 123456 NUMBER 95 FIELDS RefNum CustNum Amount Date Type TO "Ar_record_sample" OPEN MERSENNE_TWISTER
備考
メモ
このコマンドの動作の詳細については、Analytics のヘルプを参照してください。
構文
メモ
フィルターリング(IF ステートメント)や範囲パラメーターを適用するとサンプルの妥当性を低下させてしまうため、それらのオプションはこの構文に含まれていません。
固定間隔選択方法
SAMPLE <ON> MUS(金額単位サンプリング)数値フィールド INTERVAL 間隔値 <FIXED 最初の値> <CUTOFF 最上層のカットオフ値> <SUBSAMPLE> <NOREPLACEMENT> {RECORD|FIELDS フィールド名 <...n>} TO テーブル名 <LOCAL> <OPEN> <APPEND>
セル選択方法
SAMPLE <ON> MUS数値フィールド CELL INTERVAL 間隔値 <CUTOFF 最上層のカットオフ値> <RANDOM シード値> <SUBSAMPLE> <NOREPLACEMENT> {RECORD|FIELDS フィールド名 <...n>} TO テーブル名 <OPEN> <APPEND> <MERSENNE_TWISTER> <LOCAL>
ランダム選択方法
SAMPLE <ON> MUS数値フィールド NUMBER サンプルサイズ POPULATION 絶対値 <RANDOM シード値> <SUBSAMPLE> <NOREPLACEMENT> <ORDER> {RECORD|FIELDS フィールド名 <...n>} TO テーブル名 <LOCAL> <OPEN> <APPEND> <MERSENNE_TWISTER>
パラメーター
メモ
値を指定する際、3 桁の区切り記号は含めないでください。
名前 | 説明 |
---|---|
ON MUS数値フィールド |
金額単位サンプリング(monetary unit sampling:MUS)を使用します。 MUS数値フィールドは、サンプリングのベースとして使用する数値フィールドまたは式です。 |
INTERVAL 間隔値 FIXED 最初の値 | CELL INTERVAL 間隔値 | NUMBER サンプルサイズ POPULATION 絶対値 |
INTERVAL 間隔値 FIXED 最初の値固定間隔選択方法を使用します。 最初の金額単位を選択すると、その金額単位から固定した間隔、つまり固定した距離だけ離れた金額単位が続いて選択されます。たとえば、最初に選択した金額単位の後は、5000 個おきの金額単位が選択されます。
CELL INTERVAL 間隔値セル選択方法を使用します。 データ セットが複数の均等なセルまたはグループに分割され、各セルから 1 つの金額単位がランダムに選択されます。 各セルのサイズは間隔値によって指定します。 サンプル数の計算によって生成された間隔の値を入力します。 NUMBER サンプルサイズ POPULATION 絶対値ランダム選択方法を使用します。 すべての金額単位がデータセット全体からランダムに選択されます。
|
CUTOFF 最上層のカットオフ値 省略可能 |
メモ 固定間隔選択方法およびセル選択方法の場合のみ。 最上層のカットオフ値。 カットオフ値以上のMUS(Monetary Unit Sampling:金額単位サンプリング)数値フィールドの金額が自動的に選択され、 サンプルに取り込まれます。 CUTOFF を省略した場合は、間隔値に等しいデフォルトのカットオフ値が使用されます。 |
RANDOM シード値 省略可能 |
メモ セルおよびランダム選択方法の場合のみ。 Analytics の乱数ジェネレーターを初期化するために使用するシード値。 ゼロ('0')の値を指定するか、または RANDOM を省略した場合は、シード値がランダムに選択されます。 |
SUBSAMPLE 省略可能 |
メモ FIELDS を指定する場合には、SUBSAMPLE のみを使用できます。 出力結果に SUBSAMPLE フィールドを追加します。 サンプル フィールドの各金額が複数の独立した取引の合計を表す場合に、サンプリングした各合計金額のうち 1 つの取引に対してのみ監査手続きを実行したいときには、SUBSAMPLE フィールドの値を使って任意に個々の取引を選択できます。 詳細については、金額単位サンプリングの実行を参照してください。 |
NOREPLACEMENT 省略可能 |
同じレコードが複数回選択されることはありません。 このため、サンプルには SIZE コマンドで計算されたレコード数よりも少ないレコードが含まれるようになる可能性があります。 NOREPLACEMENT を省略した場合、または REPLACEMENT を指定した場合は、レコードを複数回選択できます。 |
ORDER 省略可能 |
メモ ランダム選択方法の場合のみ。 FIELDS を指定する場合には、ORDER のみを使用できます。 出力結果に ORDER フィールドを追加します。 このフィールドには、各レコードの選択順序がランダムであることが表示されます。 |
RECORD | FIELDS フィールド名 <...n> |
|
TO テーブル名 |
コマンドの結果を送信する場所:
|
LOCAL 省略可能 |
Analytics プロジェクトと同じ場所に出力ファイルを保存します。 メモ Analytics テーブルである出力ファイルを含むサーバー テーブルに対してコマンドを実行するときにのみ適用されます。 LOCAL パラメーターは TO パラメーターの直後に置く必要があります。 |
OPEN 省略可能 |
コマンドを実行した後、コマンドによって作成されたテーブルを開きます。 コマンドが出力テーブルを作成する場合にのみ有効です。 |
APPEND 省略可能 |
コマンドの出力を既存ファイルに上書きしないで、そのファイルの末尾に追加します。 メモ コマンドの出力と既存のファイルの構造が同一であるようにする必要があります。
出力は、既存ファイルとの間でファイル構造が違っている場合でも、Analytics によって既存ファイルに追加されます。 出力と既存のファイルの構造が一致しない場合は、データが混在、不足、不正確になります。 |
MERSENNE_TWISTER 省略可能 |
メモ セルおよびランダム選択方法の場合のみ。 Analytics の乱数ジェネレーターでは、メルセンヌ ツイスター アルゴリズムが使用されます。 このパラメーターを省略した場合は、Analytics のデフォルトのアルゴリズムが使用されます。 メモ バージョン 12 より前の Analytics で作成された Analytics スクリプトまたはサンプリングの結果との後方互換性が必要な場合は、単純にデフォルトの Analytics アルゴリズムを使用してください。 |
例
金額単位サンプルの抽出
金額単位サンプリングを使用して、請求書を含む勘定の金額虚偽表示の合計金額を推定します。
統計的に有効なサンプル サイズを計算した後、サンプルを抽出する準備ができています。 固定間隔選択方法を使用します。
以下の例:
- 取引金額フィールドに基づいて、開いている Analytics テーブルからサンプルを抽出する
- 間隔値 $6,283.33 で固定間隔選択方法を使用する
- 選択した最初のレコードに 100,000 ($1,000 に含まれるセント数)番目の金額単位を指定する
- 最上層のカットオフとして $5,000 を使用する
- レコード全体を出力テーブルに含める
SAMPLE ON Amount INTERVAL 6283.33 FIXED 1000.00 CUTOFF 5000.00 RECORD TO "Ar_monetary_unit_sample" OPEN
備考
メモ
このコマンドの動作の詳細については、Analytics のヘルプを参照してください。