レコード サンプリングのチュートリアル
このチュートリアルでは、Analytics におけるレコード サンプリングのエンドツーエンド プロセスの概要を説明します。
予定所要時間 20 分
サマリー Vouchers(伝票)テーブルから、レコードで構成されるサンプルを抽出し、そのサンプルから統制からの逸脱を検出します。サンプルからの検出結果に基づいて、テーブル全体の逸脱率を統計的に推定します。
この統計的推定値を使って、伝票統制プロセスが有効に運用されているかどうかを判定します。
主なタスク レコード サンプリングを正しく実行するには、主なタスクとして以下の 4 つを実行する必要があります。
レコード サンプリングについて、オプションの使用方法は省略して、オプションなしでの使用方法のみを説明しているため、Analytics のレコード サンプリングの使用方法の基本をすばやく理解できます。
ヒント
サンプリング用語については、用語に関する単語に簡潔に定義されていますので参照してください。
レコード サンプリングのシナリオ
伝票統制プロセスのテスト
シナリオ
5000 レコードを超える Vouchers テーブルを検査するとします。伝票のサンプルのハードコピーを抽出して、システム入力と一致し、伝票統制プロセスが効果的に機能していることを確認しようとしています。
ハードコピーを確認し、次の点を確認します。
- 伝票が承認された
- 同じ人が伝票を作成して承認していない
どのように進めるか?
いくつのハード コピーを抽出するか?どれを抽出するかをどのように決定するか?サンプルから検出した統制からの逸脱が伝票の母集団全体ではどのように分布しているか?
Analytics レコード サンプリングを使用して、これらの質問に対する回答を得ることができます。
このシナリオで使用される Analytics テーブル
このシナリオは Analytics に含まれる ACL_Rockwood.acl サンプル データ ファイルの Vouchersテーブルを使用します。
メモ
値を指定する際、3 桁の区切り記号やパーセント記号は含めないでください。これらの文字を使用すると、コマンドを実行できないか、エラーが発生します。
1 有効なサンプル サイズの計算
メモ
本番環境では、有効なサンプル サイズを計算するために指定する値は、専門家の判断によって異なります。
- ACL_Rockwood.acl で、Acquisitions_Payment にある Vouchers テーブルを開きます。
- [サンプリング > レコード/金額単位サンプリング > サイズの計算]を選択します。
- [レコード]オプションを選択します。
- 以下の画面に表示されている入力値を指定し、[計算]をクリックしてサンプル サイズを計算します。
結果を確認した後、[OK]をクリックしてサンプル サイズ計算を確定するか、異なる値を指定して実験します(以下を参照)。
入力値の意味
入力値 | 説明 |
---|---|
信頼度 |
抽出するサンプルが母集団全体を表している信頼度が 95% 必要です。 別の方法:サンプルを 100 回抽出した場合、95 回表し、5 回のみ表しません。 |
母集団 |
Vouchers テーブルのレコードの総数 |
上限誤謬 (%) |
伝票の最大 2% は適切な承認がないことがあり、統制はまだ効果的であると見なします。 |
想定誤謬率 (%) | 伝票の 1% が適切な承認がないと想定します。 |
結果の意味
結果項目 | 説明 |
---|---|
サンプル サイズ | 593 のハードコピー伝票を抽出します。 |
間隔 |
サンプル選択の間隔方法のいずれかを使用する場合、選択したレコードは以下のいずれかです。
メモ 8.93 は最大 9 に四捨五入されます。 |
許容誤謬数 |
メモ この数字は、統制の逸脱を評価するための代替方法であり、このレコード サンプリング チュートリアルでは使用しません。 この数字の意味:
|
詳細:異なる値を指定した実験
[サイズ]ダイアログ ボックスの次のフィールドのいずれかで値を変更し、[計算]をクリックして、結果がどのように変わるのかを観察します。1 度に 1 つの値のみを変更し、変更がどのように結果に影響するのかをわかりやすくします。
- 信頼度
- 上限誤謬 (%)
- 想定誤謬率 (%)
より厳密な要件により、サンプル サイズが大きくなります。より緩い要件により、サンプル サイズが小さくなります。
上の画面に合うように値をリセットし、[OK]をクリックします。サンプル サイズ計算の結果で[サイズ]タブを固定します。
2 レコードのサンプルを抽出する
- [Vouchers テーブルに戻ります。
- [サンプリング > レコード/金額単位サンプリング > サンプル]を選択します。
- [レコード]オプションを選択します。
- 以下の画面に表示されている値を指定し、[OK]をクリックしてレコードのサンプルを抽出します。
入力値の意味
入力値 | 説明 |
---|---|
セル |
サンプル レコードを抽出するためにセル選択方法を使用しています。 セル選択方法では、同じサイズのセルまたはレコードのブロック内からランダムに選択されるレコード選択方法。 |
間隔 |
各セルのサイズは 9 レコードです。8.93 は最大 9 に四捨五入されます。 |
シード値 |
Analytics で乱数ジェネレーターを初期化するために使用されるシード値 456654。任意のシード値を指定できます。 乱数ジェネレーターは、各セルから選択されるレコード数を指定します。 |
アルゴリズム | 乱数ジェネレーターはメルセンヌ・ツイスタ アルゴリズムを使用して、乱数を生成します。 |
変換先 |
Vouchers テーブルから抽出されたレコードのサンプルは、新しいテーブル Vouchers_sample に出力されます。 メモ Analytics は間隔を 9 に切り上げ、抽出された実際のレコード数は計算されたサンプル サイズ 593 より少し小さくなります。 |
3 サンプルで分析を実行する
このチュートリアルでは、以下を行うものとします。
- Vouchers_sample テーブルに出段する伝票番号のハードコピーを抽出します。
- 各伝票を検査し、適切な承認がない伝票を記録します。
4 母集団全体に対する分析結果の適用
- [サンプリング > レコード/金額単位サンプリング > 評価]を選択します。
メモ
メニュー オプションは、テーブルが開いていない場合は無効です。
- [レコード]オプションを選択します。
- 以下の画面に表示されている入力値を指定し、[OK]をクリックして分析結果を適用します。
入力値の意味
入力値 | 説明 |
---|---|
信頼度 |
サンプル サイズの計算時に指定したのと同じ信頼度。 |
サンプル サイズ |
抽出したサンプルの実際のレコード数。つまり Vouchers_sample テーブルのレコード数。 |
誤謬数 |
ハードコピーを検査したときに、適切な承認がなかった伝票数。 |
推定/適用される分析結果の意味
結果項目 | 説明 |
---|---|
上限誤謬頻度 |
95% の信頼度で推定された伝票の母集団全体の最大逸脱率。 別の方法:Vouchers テーブルの適切な承認がない伝票数が 1.79% または 95 伝票を超えないという 95% の確率があります。 1.79% はサンプル サイズを計算したときに上限誤謬 (%) に指定した 2% より小さいため、伝票統制が有効に運用されていると結論付けることができます。 詳細については、「上限誤謬頻度」の意味を参照してください。 |
詳細:異なる値を指定した実験
異なる誤謬数で評価コマンドを再実行し、結果がどのように変わるのかを確認します。
以下の表は一部の異なる結果を要約しています。
誤謬数 (サンプル) |
上限誤謬頻度 (推定された最大値) |
Vouchers テーブルで承認がない伝票 (推定された最大値) |
結論 |
---|---|---|---|
5 | 1.79% | 95 (0.0179 x 5298) |
伝票の統制は有効に運用されています。 1.79% < 上限誤謬 2.00% |
6 | 2.02% | 107 (0.0202 x 5298) |
厳密には、伝票の統制は有効に運用されていません。 ただし、2.02% は上限誤謬 2.00% に非常に近いです。 メモ この例は、上限誤謬頻度と許容誤謬数の間の差異を示し、統制逸脱を評価します。 より緩い許容誤謬数方法を使用する場合、伝票の統制が有効に運用されています。 左の "誤謬数" 列の観察された誤謬数は 6 です。これは、サンプル サイズを計算したときに報告された許容誤謬数の 6 を超えていません。 |
7 | 2.24% | 119 (0.0224 x 5298) |
伝票の統制は有効に運用されていません。 2.24% > 上限誤謬 2.00% |
10 | 2.89% | 153 (0.0289 x 5298) |
伝票の統制は有効に運用されていません。 2.89% > 上限誤謬 2.00% |