ベンフォード分析の実行

ベンフォード分析は、フィールドに表示される最初の桁(1 ~ 9)や最初の桁の組み合わせの数をカウントし、実数と予測数を比較します。

ベンフォード式で計算された、想定されたカウントは、ベンフォード分布を提供します。自然に発生する数字のセットにおいて、先頭の数の実際のカウントの頻度分布は、ベンフォード分布に近似します。

テストされるデータの 1 つ以上の先頭の数または数の組み合わせが、ベンフォード分布から大幅に逸脱している場合は、数が操作された可能性があることを示すことがあります。逸脱はシンプルかつ合理的な説明である場合もあり、必ずしも操作を示すものではありません。

ベンフォード分析を使用してテストできるデータ

ベンフォード分析は、会計金額、取引金額、費用、またはアドレス番号などの「自然発生数」から構成される数値データをテストする目的でのみ、使用してください。ベンフォード分析は、いかなる方法でも制約を受けた数値データには適していません。

ベンフォード分析に適した数値データを特定するには、次のガイドラインに従ってください。

  • データセットのサイズ 有効は分布をサポートするには、データセットが十分に大きいサイズである必要があります。ベンフォード分析では、499 レコード以下の場合には、信頼できる結果が得られない場合があります。
  • 先頭の数の要件1 ~ 9 のすべての数値が、先頭の数として発生する可能性がなければなりません。
  • 先頭の数の組み合わせの要件0 ~ 9 のすべての数値が、先頭から 2 番目の数および分析対象の追加の数として発生する可能性がなければなりません。
  • 制約されたデータ あらかじめ定義されたパターンに従って割り当てまたは生成された数値データは、ベンフォード分析に適していません。たとえば、次の分析では、ベンフォード分析を使用しないでください。
    • 連番の小切手または請求書番号
    • 特定のパターンにマッピングされる社会保障番号または電話番号
    • 特定の数字が出現しない範囲がある番号体系
  • 乱数乱数生成器で生成された数値は、ベンフォード分析に適していません。

使用の詳細

以下の表は、Analytics でのベンフォード分析の使用に関する詳細を示します。

分析する先頭桁数 先頭桁数を最高 6 桁まで分析できます。4 桁以上を分析する場合、ベンフォード分析の結果は、画面に表示したり、プリンターへ送信したりするのではなく、ファイルに出力する必要があります。
処理時間 作業対象のレコード数にもよりますが、5 桁以上の先頭桁数の分析には数分かかる可能性があります。分析している桁数にかかわらず、Esc キーを押せばいつでもこのコマンドを終了させることができます。
データセットのサイズ 効果的にベンフォード分析を実行するには、大きなデータ セットが必要になります。Analytics では、指定した桁数に対してデータ セットが小さすぎると、結果出力で警告メッセージが表示されます。
正の値と負の値 正の値と負の値を別々に分析すると、異常なデータはより明白になります。分析を始める前にフィルターを使用して、正と負の値を分けます。
ゼロおよび数値以外の文字

値がゼロのレコードは無視されますが、その除外されたレコード数は報告されます。

また、先頭にあるゼロ、小数点やドル記号などの数値書式、およびその他の数値以外の桁、さらにテスト基準を満たさないレコードも無視されます。結果として出された数字の桁数が指定した数より少ない場合は、Analytics は結果の右側にゼロを追加します。

ベンフォード分析出力結果

ベンフォード分析では以下の出力結果が生成されます。

先頭桁 検証する先頭桁が表示されます。たとえば、1 桁の先頭桁を指定した場合、1 から 9 の数字が表示されます。2 桁の 先頭桁を指定した場合は、10 から 99 の数字が表示されます。
実数 各先頭桁の総数か、フィールドに含まれる先頭桁の組み合わせの実際の総数が表示されます。
予測数 べンフォードの法則に従って計算された、各先頭桁の予測数か、先頭桁の組み合わせの予測数が表示されます。
Z 統計量 実際のカウントと予測されるカウントの間の距離の標準偏差の測定である、各数または数の組み合わせの Z 統計量を示します。たとえば、Z 統計量 0.500 は標準偏差の半分を表します。

下限範囲

上限範囲

(省略可能)

各先頭の数または数の組み合わせのカウントの計算された上限値と下限値を示します。

出力結果の複数の桁または桁の組み合わせの実際のカウントが境界のいずれかを超える場合、データは操作された可能性があり、調査が必要になります。

メモ

下限上限の値が含まれるのは、[ベンフォード]ダイアログ ボックスの[上限および下限を含める]チェック ボックスをオンにした場合のみです。

手順

フィールドでベンフォード分析を実施し、1 つ以上の先頭の数または数の組み合わせがベンフォード分布から大幅に逸脱するかどうかを検査します。

Analytics 14.1 ヘルプ