Concept Information
アクティブなテーブルにある金額データの代表サンプルを含むテーブルを新たに作成することができます。
金額単位サンプリング ファイルの虚偽表示の合計額に関心がある場合に適しています。
メモ
この手順には、フィルタリング(IF 文)または範囲パラメーターは含まれません。これらのオプションを適用すると、サンプルの有効性が損なわれます。
手順
メモ
手順の後に詳細情報が表示されます。サンプル ダイアログ ボックスのオプションを参照してください。
値を指定する際、3 桁の区切り記号やパーセント記号は含めないでください。これらの文字を使用すると、コマンドを実行できないか、エラーが発生します。
- ナビゲーターで、サンプルを抽出するテーブルを開きます。
- 省略可能。[ランダム]選択方法を使用する場合は、サンプルフィールドで統計をプロファイリングまたは生成します。
- [サンプリング > レコード/金額単位サンプリング > サンプル]を選択します。
- [メイン]タブで、[MUS]を選択します。
- [サンプルの対象]ドロップダウンリストからサンプリングの対象となるフィールドを選択します。
- [サンプル パラメーター]パネルで、サンプルの選択方法を指定します。
- 固定間隔
- セル
- RANDOM
メモ
Analytics を使用して結果サンプルで検出された虚偽の表示を評価する場合は、金額単位サンプルでランダム選択方法を使用しないでください。
金額単位サンプルの評価には、固定間隔またはセル選択方法を使用する必要があります。
- 選択した選択方法のサンプル パラメーターを入力します。
選択方法 サンプル パラメーター 固定間隔 - 間隔
- 開始(省略可能) セル
- カットオフ(省略可能)
セル - 間隔
- シード値(省略可能)
- カットオフ(省略可能)
- アルゴリズム – メルセンヌ・ツイスタを選択します
ランダム - サイズ
- シード値(省略可能)
- 母集団
- アルゴリズム – メルセンヌ・ツイスタを選択します
メモ
サンプル パラメーターは、以下で詳細に説明されます。
- [保存先]テキスト ボックスで、出力結果を含める Analytics テーブルの名前を指定します。
- [詳細]タブで、次のいずれかを選択します。
レコードレコード全体が出力テーブルに含まれます。
フィールド 選択したフィールドのみが出力テーブルに含まれます。
- [フィールド]を選択した場合は、[抽出フィールド]リストから出力テーブルに含めるフィールドを選択します。
- 省略可能。以下のオプションを必要に応じて選択します。
- SUBSAMPLE
- レポート選択順序
- 繰り返しなし
メモ
オプションは以下で説明します。
[サブサンプル]は、出力に "フィールド" を選択した場合のみ選択可能です。
[抽出順序をレポートする]は、ランダム選択方法およびフィールド出力の両方が選択された場合にのみ利用可能です。
- [OK]をクリックします。
サンプル ダイアログ ボックスのオプション
次の表は、[サンプル]ダイアログ ボックスのオプションの詳細を示します。
[メイン]タブ
| オプション - サンプル ダイアログ ボックス | 説明 |
|---|---|
| MUSMUS
レコード |
サンプルの種類:
|
| サンプルの対象 |
数値サンプル フィールド。
|
| 固定間隔 |
固定間隔がサンプル選択で使用されることを指定します。 サンプルは、間隔値と指定した開始番号に基づいて選択されます。詳細については、固定間隔選択方法を参照してください。 [固定間隔]を選択した場合は、次の値を入力します。
|
| セル |
セル方法をサンプル選択で使用することを指定します。 データ セットが複数の均等なセルまたはグループに分割され、各セルから 1 つのサンプルがランダムに選択されます。各セルのサイズは間隔値によって指定します。詳細については、セル選択方法を参照してください。 [セル]を選択した場合は、次の値を入力します。
|
| ランダム |
ランダム方法をサンプル選択で使用することを指定します。 サンプルはデータセット全体からランダムに選択されます。詳細については、ランダム選択方法を参照してください。 [ランダム]を選択した場合は、次の値を入力します。
|
| もし次の | |
| 変換先 | 出力テーブルの名前と場所。
保存する出力テーブルの場所に関係なく、そのテーブルが開いているプロジェクトにまだ存在しないときは、プロジェクトに追加されます。 Analytics によってテーブル名があらかじめ設定されている場合は、その設定されている名前を受け入れることも、あるいは変更することもできます。 メモ Analytics のテーブル名は、最長で 64 文字の英数字(拡張子 .FIL を含まない)に制限されます。名前にはアンダースコア文字(_)を使用できますが、他の特殊文字やスペースは使用できません。名前の先頭を数字にすることはできません。 |
| ローカル |
サーバー テーブルに接続している場合は、出力テーブルを保存する場所を指定します。
|
| 出力テーブルを使用する | 操作の完了時に、出力結果を含んでいる Analytics テーブルを自動的に開くかどうかを指定します。 |
[詳細]タブ
| オプション - サンプル ダイアログ ボックス | 説明 |
|---|---|
| [範囲]パネル | |
|
レコード フィールド |
レコード全体、または選択したフィールドを出力テーブルに含めるかどうかを指定します。 [フィールド]を選択する場合は、次のいずれかを実行します。 [フィールドの抽出]リストから抽出するフィールドを選択します。 [フィールドの抽出]をクリックして、フィールドを選択するか、または式を作成します。 フィールドを選択する順序が、結果に表示する列の順序になります。既存の Analytics テーブルに結果を追加する場合は、結果と既存テーブル内の列の選択と順序は同一である必要があります。 |
|
サブサンプル レポート選択順序 繰り返しなし |
(省略可能)追加のサンプリング オプション。 以下のオプションを必要に応じて選択します。
メモ [サブサンプル]は、出力に "フィールド" を選択した場合のみ選択可能です。 [抽出順序をレポートする]は、ランダム選択方法およびフィールド出力の両方が選択された場合にのみ利用可能です。 [繰り返しなし]では、選択したレコードが後から選択できなくなり、サンプルのサイズが縮小することがあります。それを補うため、データ セットのオーバーサンプリングすることを検討してください。 詳細については、繰り返しなしのサンプル選択を参照してください。 |
| 既存のファイルに追加する | 出力結果が既存の Analytics テーブルの最後に追加されることを指定します。 メモ 出力結果と既存のテーブルの構造が同一であるかどうかが不確かな場合は、[既存のファイルに追加する]を選択解除されたままにしておくことをお勧めします。 追加およびデータ構造の詳細については、既存テーブルへの出力結果の追加を参照してください。 |
| OK | 処理を実行します。 上書きを確認するメッセージが表示されたら、適切なオプションを選択します。 [最後に追加]オプションが表示されることを期待していたのに表示されない場合は、[いいえ]をクリックして操作をキャンセルし、既存テーブルへの出力結果の追加を参照してください。 |
金額単位サンプリングのオプション
金額単位サンプリングの場合に限り、以下のオプションを指定することができます。
- 最上層のカットオフ
- サブサンプル
- 繰り返しなしのサンプル選択
最上層のカットオフ
メモ
最上層のカットオフは、固定間隔またはセルの選択方法を使用する金額単位のサンプリングにのみ利用できます。
最上層のカットオフは、多額の金額単位のサンプリングにバイアスをかけるために Analytics が使用する追加的な方法です。デフォルトでは、間隔値以上のサンプル フィールドの金額が最上層の金額と見なされ、自動的にサンプルに取り込まれます。
負の金額と正の金額を自動で取り込むことができます。見なされる金額が絶対値であるためです。
自動選択の金額が大きければ大きいほど、サンプル サイズも大きくなります。
間隔値より大きいまたは小さい最上層のカットオフの値を任意で指定することができます。
| 最上層のカットオフ値 | 影響 |
|---|---|
|
間隔値よりも大きい |
より大きい金額がサンプルに自動的に含まれる確率が下がります。 サンプル フィールドの最大の正または負の金額よりも大きいカットオフ値を指定する場合、金額は自動的に選択されません。 |
|
間隔値よりも小さい |
より大きい金額がサンプルに自動的に含まれる確率が上がります。 デフォルトの最上層のカットオフを使用して金額が自動的に選択されない場合は、カットオフ値を下に調整し、サンプル フィールドでより大きい金額の一部を自動的に選択できます。 注意 サンプルフィールド金額と比較して小さすぎるカットオフ値を指定した場合、自動的に選択される金額が多くなりすぎ、サンプルの目的に沿わなくなります。 |
ログに記録された最上層の選択と金額
金額単位サンプルを実行するときには、最上層の選択数と合計最上層の金額がログに表示されます。
例
ログは、93 の選択したレコードのうちの 8 が最上層であり、数値サンプル フィールドの絶対値 $33,153.55 を占めるのことを示します。
サンプル サイズ = サンプリングされた 733 レコード中、93(8 最上位の階層)
母集団:585674.41、最上位の階層:33153.55、その他:552520.86
サブサンプル
メモ
サブサンプリングは、金額単位サンプリングでフィールドの出力を使用した場合にのみ使用することができます。
場合によっては、サンプル フィールドの各金額が複数の個別の取引の合計を表します。サンプリングした各合計金額のうち 1 つの取引に対してのみ監査手続きを実行したいときには、サブサンプリングを使って任意に個々の取引を選択できます。
[サンプル]ダイアログ ボックスで[サブサンプリング]を選択すると、結果のサンプルに SUBSAMPLE フィールドが含まれます。このフィールドには、合計金額と合計金額を選択するために使用される実際の金額単位との間の差異を表す金額が含まれます。
例
| $12,455 | (合計金額) |
| - $4,620 | (選択した金額単位) |
| = $7,835 | (SUBSAMPLE フィールドに表示された金額) |
処理を完了するには、その特定の合計金額の累積残高に 7,835 番目のドルを含む取引を選択します。
メモ
サンプルのすべての最上層のカットオフ金額は “0.00” を SUBSAMPLE フィールドに表示します。これらはサンプルに自動的に含まれ、金額単位はその選択に関係しないためです。
繰り返しなしのサンプル選択
金額単位サンプリングは同じレコードを複数回選択する場合があります。サンプル フィールドの各金額には複数の金額単位が含まれ、同じ金額に属する 2 つ以上の金額単位を選択できます。これにより、金額を含むレコードが複数回選択されます。
[サンプル]ダイアログ ボックスで[繰り返しなし]を選択すると、同じレコードが複数回選択されないようにできます。結果のサンプルには重複が含まれません。ただし、サンプリングされたレコード数は Analytics によって計算されたサンプル サイズよりも小さくなる場合があります。補正するには、次の方法のいずれかを使用して、サンプル サイズを増やし、オーバーサンプリングできます。
-
固定間隔またはセル選択方法:
- 間隔のサイズを下げる
- 最上層のカットオフ値を調整し、自動的に選択するレコード数を増やす
- ランダム選択方法は指定されたサンプル サイズを増やします