SAMPLE コマンド

レコード サンプリングまたは金額単位サンプリング方法を使用して、レコードのサンプルを抽出します。

構文

メモ

フィルターリング(IF ステートメント)や範囲パラメーターを適用するとサンプルの妥当性を低下させてしまうため、それらのオプションはこの構文に含まれていません。

固定間隔選択方法

SAMPLE <ON> RECORD INTERVAL 間隔値 <FIXED 初期値> {RECORD|FIELDS フィールド名 <...n>} TO テーブル名 <LOCAL> <OPEN> <APPEND>

セル選択方法

SAMPLE <ON> RECORD CELL INTERVAL 間隔値 <RANDOM シード値> {RECORD|FIELDS フィールド名 <...n>} TO テーブル名  <LOCAL> <OPEN> <APPEND> <MERSENNE_TWISTER>

ランダム選択方法

SAMPLE <ON> RECORD NUMBER サンプルサイズ <RANDOM シード値> <ORDER> {RECORD|FIELDS フィールド名 <...n>} TO テーブル名 <LOCAL> <OPEN> <APPEND> <MERSENNE_TWISTER>

パラメーター

メモ

値を指定する際、3 桁の区切り記号は含めないでください。

名前 説明
ON RECORD レコード サンプリングを使用します。
INTERVAL 間隔値 FIXED 最初の値 | CELL INTERVAL 間隔値 | NUMBER サンプルサイズ

INTERVAL 間隔値 FIXED 最初の値

固定間隔選択方法を使用します。

最初のレコードを選択すると、そのレコードから固定した間隔、つまり固定した距離だけ離れたレコードが続いて選択されます。たとえば、最初に選択したレコードの後は、20 件に 1 件のレコードが選択されます。

  • INTERVAL の間隔値には、サンプル サイズの計算によって出力された間隔値を指定します。
  • FIXED の最初の値には、選択する最初のレコード番号を指定します。

    最初の値にゼロ('0')を指定するか、FIXED を省略した場合は、Analytics により最初のレコードがランダムに選択されます。

CELL INTERVAL 間隔値

セル選択方法を使用します。

データ セットが複数の均等なセルまたはグループに分割され、各セルから 1 つのレコードがランダムに選択されます。

各セルのサイズは間隔値によって指定します。 サンプル数の計算によって生成された間隔の値を入力します。

NUMBER サンプルサイズ

ランダム選択方法を使用します。

すべてのレコードがデータセット全体からランダムに選択されます。

サンプル サイズの計算によって生成されたサンプル サイズを入力します。

RANDOM シード値

省略可能

メモ

セルおよびランダム選択方法の場合のみ。

Analytics の乱数ジェネレーターを初期化するために使用するシード値。

ゼロ('0')の値を指定するか、または RANDOM を省略した場合は、シード値がランダムに選択されます。

ORDER

省略可能

メモ

ランダム選択方法の場合のみ。

FIELDS を指定する場合には、ORDER のみを使用できます。

出力結果に ORDER フィールドを追加します。

このフィールドには、各レコードの選択順序がランダムであることが表示されます。

RECORD | FIELDS フィールド名 <...n>
  • RECORD レコード全体が出力テーブルに含まれます。
  • FIELDS レコード全体でなく、個々のフィールドが出力テーブルに含まれます。

    含めるフィールドまたは式を指定します。 複数のフィールドを指定する場合、空白によってそれぞれのフィールドを区切る必要があります。

TO テーブル名

コマンドの結果を送信する場所:

  • テーブル名は、結果の保存先となる Analytics テーブルのことです。

    テーブル名には、ファイル拡張子 .FIL を付けた文字列を引用符で囲んで指定する必要があります。 例:TO "Output.FIL"

    デフォルトでは、テーブル データ ファイル(.fil)は、Analytics プロジェクトが入っているフォルダーに保存されます。

    既存の異なるフォルダーにデータ ファイルを保存するには、絶対または相対ファイル パスを指定します。

    • TO "C:\Output.FIL"
    • TO "Results\Output.FIL"

    メモ

    テーブル名は 64 文字の英数字(.FIL 拡張子を含まない)に制限されています。 名前にはアンダースコア文字(_)を使用できますが、他の特殊文字やスペースは使用できません。 名前の先頭を数字にすることはできません。

LOCAL

省略可能

Analytics プロジェクトと同じ場所に出力ファイルを保存します。

メモ

Analytics テーブルである出力ファイルを含むサーバー テーブルに対してコマンドを実行するときにのみ適用されます。

LOCAL パラメーターは TO パラメーターの直後に置く必要があります。

OPEN

省略可能

コマンドを実行した後、コマンドによって作成されたテーブルを開きます。 コマンドが出力テーブルを作成する場合にのみ有効です。

APPEND

省略可能

コマンドの出力を既存ファイルに上書きしないで、そのファイルの末尾に追加します。

メモ

コマンドの出力と既存のファイルの構造が同一であるようにする必要があります。

  • 同じフィールド
  • 同じフィールド順序
  • 一致するフィールドが同じ長さ
  • 一致するフィールドが同じデータ型

出力は、既存ファイルとの間でファイル構造が違っている場合でも、Analytics によって既存ファイルに追加されます。 出力と既存のファイルの構造が一致しない場合は、データが混在、不足、不正確になります。

MERSENNE_TWISTER

省略可能

メモ

セルおよびランダム選択方法の場合のみ。

Analytics の乱数ジェネレーターでは、メルセンヌ ツイスター アルゴリズムが使用されます。

このパラメーターを省略した場合は、Analytics のデフォルトのアルゴリズムが使用されます。

メモ

バージョン 12 より前の Analytics で作成された Analytics スクリプトまたはサンプリングの結果との後方互換性が必要な場合は、単純にデフォルトの Analytics アルゴリズムを使用してください。

レコード サンプルの抽出

レコード サンプルを使用して、請求書を含む勘定の規定された統制からの逸脱率を推定します。

統計的に有効なサンプル サイズを計算した後、サンプルを抽出する準備ができています。 ランダム選択方法を使用します。

以下の例:

  • 開いている Analytics テーブルからサンプルを抽出する
  • シード値 123456 を指定してランダム選択方法を使用する
  • サンプルサイズとして 95 レコードを指定する
  • 指定したフィールドのみを出力テーブルに含める
  • Analytics の乱数ジェネレーターでメルセンヌツイスター アルゴリズムを使用することを指定する
SAMPLE ON RECORD RANDOM 123456 NUMBER 95 FIELDS RefNum CustNum Amount Date Type TO "Ar_record_sample" OPEN MERSENNE_TWISTER

備考

メモ

このコマンドの動作の詳細については、Analytics のヘルプを参照してください。

構文

メモ

フィルターリング(IF ステートメント)や範囲パラメーターを適用するとサンプルの妥当性を低下させてしまうため、それらのオプションはこの構文に含まれていません。

固定間隔選択方法

SAMPLE <ON> MUS(金額単位サンプリング)数値フィールド INTERVAL 間隔値 <FIXED 最初の値> <CUTOFF 最上層のカットオフ値> <SUBSAMPLE> <NOREPLACEMENT> {RECORD|FIELDS フィールド名 <...n>} TO テーブル名 <LOCAL> <OPEN> <APPEND>

セル選択方法

SAMPLE <ON> MUS数値フィールド CELL INTERVAL 間隔値 <CUTOFF 最上層のカットオフ値> <RANDOM シード値> <SUBSAMPLE> <NOREPLACEMENT> {RECORD|FIELDS フィールド名 <...n>} TO テーブル名 <OPEN> <APPEND> <MERSENNE_TWISTER> <LOCAL>

ランダム選択方法

SAMPLE <ON> MUS数値フィールド NUMBER サンプルサイズ POPULATION 絶対値 <RANDOM シード値> <SUBSAMPLE> <NOREPLACEMENT> <ORDER> {RECORD|FIELDS フィールド名 <...n>} TO テーブル名 <LOCAL> <OPEN> <APPEND> <MERSENNE_TWISTER>

パラメーター

メモ

値を指定する際、3 桁の区切り記号は含めないでください。

名前 説明
ON MUS数値フィールド

金額単位サンプリング(monetary unit sampling:MUS)を使用します。

MUS数値フィールドは、サンプリングのベースとして使用する数値フィールドまたは式です。

INTERVAL 間隔値 FIXED 最初の値 | CELL INTERVAL 間隔値 | NUMBER サンプルサイズ POPULATION 絶対値

INTERVAL 間隔値 FIXED 最初の値

固定間隔選択方法を使用します。

最初の金額単位を選択すると、その金額単位から固定した間隔、つまり固定した距離だけ離れた金額単位が続いて選択されます。たとえば、最初に選択した金額単位の後は、5000 個おきの金額単位が選択されます。

  • INTERVAL の間隔値には、サンプル サイズの計算によって出力された間隔値を指定します。
  • FIXED の最初の値には、選択する最初の金額単位を指定します。

    最初の値にゼロ('0')を指定するか、FIXED を省略した場合は、Analytics により最初の金額単位がランダムに選択されます。

CELL INTERVAL 間隔値

セル選択方法を使用します。

データ セットが複数の均等なセルまたはグループに分割され、各セルから 1 つの金額単位がランダムに選択されます。

各セルのサイズは間隔値によって指定します。 サンプル数の計算によって生成された間隔の値を入力します。

NUMBER サンプルサイズ POPULATION 絶対値

ランダム選択方法を使用します。

すべての金額単位がデータセット全体からランダムに選択されます。

  • NUMBERサンプルサイズには、計算によって出力されたサンプル サイズを入力します。
  • POPULATION の絶対値には、MUS数値フィールドの絶対値合計額を指定します。この合計額が、サンプルの選択元の母集団になります。
CUTOFF 最上層のカットオフ値

省略可能

メモ

固定間隔選択方法およびセル選択方法の場合のみ。

最上層のカットオフ値。

カットオフ値以上のMUS(Monetary Unit Sampling:金額単位サンプリング)数値フィールドの金額が自動的に選択され、 サンプルに取り込まれます。

CUTOFF を省略した場合は、間隔値に等しいデフォルトのカットオフ値が使用されます。

RANDOM シード値

省略可能

メモ

セルおよびランダム選択方法の場合のみ。

Analytics の乱数ジェネレーターを初期化するために使用するシード値。

ゼロ('0')の値を指定するか、または RANDOM を省略した場合は、シード値がランダムに選択されます。

SUBSAMPLE

省略可能

メモ

FIELDS を指定する場合には、SUBSAMPLE のみを使用できます。

出力結果に SUBSAMPLE フィールドを追加します。

サンプル フィールドの各金額が複数の独立した取引の合計を表す場合に、サンプリングした各合計金額のうち 1 つの取引に対してのみ監査手続きを実行したいときには、SUBSAMPLE フィールドの値を使って任意に個々の取引を選択できます。

詳細については、金額単位サンプリングの実行を参照してください。

NOREPLACEMENT

省略可能

同じレコードが複数回選択されることはありません。 このため、サンプルには SIZE コマンドで計算されたレコード数よりも少ないレコードが含まれるようになる可能性があります。

NOREPLACEMENT を省略した場合、または REPLACEMENT を指定した場合は、レコードを複数回選択できます。

ORDER

省略可能

メモ

ランダム選択方法の場合のみ。

FIELDS を指定する場合には、ORDER のみを使用できます。

出力結果に ORDER フィールドを追加します。

このフィールドには、各レコードの選択順序がランダムであることが表示されます。

RECORD | FIELDS フィールド名 <...n>
  • RECORD レコード全体が出力テーブルに含まれます。
  • FIELDS レコード全体でなく、個々のフィールドが出力テーブルに含まれます。

    含めるフィールドまたは式を指定します。 複数のフィールドを指定する場合、空白によってそれぞれのフィールドを区切る必要があります。

TO テーブル名

コマンドの結果を送信する場所:

  • テーブル名は、結果の保存先となる Analytics テーブルのことです。

    テーブル名には、ファイル拡張子 .FIL を付けた文字列を引用符で囲んで指定する必要があります。 例:TO "Output.FIL"

    デフォルトでは、テーブル データ ファイル(.fil)は、Analytics プロジェクトが入っているフォルダーに保存されます。

    既存の異なるフォルダーにデータ ファイルを保存するには、絶対または相対ファイル パスを指定します。

    • TO "C:\Output.FIL"
    • TO "Results\Output.FIL"

    メモ

    テーブル名は 64 文字の英数字(.FIL 拡張子を含まない)に制限されています。 名前にはアンダースコア文字(_)を使用できますが、他の特殊文字やスペースは使用できません。 名前の先頭を数字にすることはできません。

LOCAL

省略可能

Analytics プロジェクトと同じ場所に出力ファイルを保存します。

メモ

Analytics テーブルである出力ファイルを含むサーバー テーブルに対してコマンドを実行するときにのみ適用されます。

LOCAL パラメーターは TO パラメーターの直後に置く必要があります。

OPEN

省略可能

コマンドを実行した後、コマンドによって作成されたテーブルを開きます。 コマンドが出力テーブルを作成する場合にのみ有効です。

APPEND

省略可能

コマンドの出力を既存ファイルに上書きしないで、そのファイルの末尾に追加します。

メモ

コマンドの出力と既存のファイルの構造が同一であるようにする必要があります。

  • 同じフィールド
  • 同じフィールド順序
  • 一致するフィールドが同じ長さ
  • 一致するフィールドが同じデータ型

出力は、既存ファイルとの間でファイル構造が違っている場合でも、Analytics によって既存ファイルに追加されます。 出力と既存のファイルの構造が一致しない場合は、データが混在、不足、不正確になります。

MERSENNE_TWISTER

省略可能

メモ

セルおよびランダム選択方法の場合のみ。

Analytics の乱数ジェネレーターでは、メルセンヌ ツイスター アルゴリズムが使用されます。

このパラメーターを省略した場合は、Analytics のデフォルトのアルゴリズムが使用されます。

メモ

バージョン 12 より前の Analytics で作成された Analytics スクリプトまたはサンプリングの結果との後方互換性が必要な場合は、単純にデフォルトの Analytics アルゴリズムを使用してください。

金額単位サンプルの抽出

金額単位サンプリングを使用して、請求書を含む勘定の金額虚偽表示の合計金額を推定します。

統計的に有効なサンプル サイズを計算した後、サンプルを抽出する準備ができています。 固定間隔選択方法を使用します。

以下の例:

  • 取引金額フィールドに基づいて、開いている Analytics テーブルからサンプルを抽出する
  • 間隔値 $6,283.33 で固定間隔選択方法を使用する
  • 選択した最初のレコードに 100,000 ($1,000 に含まれるセント数)番目の金額単位を指定する
  • 最上層のカットオフとして $5,000 を使用する
  • レコード全体を出力テーブルに含める
SAMPLE ON Amount INTERVAL 6283.33 FIXED 1000.00 CUTOFF 5000.00 RECORD TO "Ar_monetary_unit_sample" OPEN

備考

メモ

このコマンドの動作の詳細については、Analytics のヘルプを参照してください。