重複の検査

1 つ以上のフィールドの値が重複している、すなわち重複レコードは、データの入力ミスの結果であるか、もしくは調査を回避するためにクレジット カードの決済を分けている、などの不正行為の結果である可能性があります。

一意の値の要件

重複を含んではいけないフィールドとは、その値によってレコードを一意に識別するフィールドです。たとえば、従業員テーブルの場合、従業員番号は各従業員を一意に識別するものなので重複してはいけません。

有効な重複

重複値が有効な場合もあります。たとえば、取引テーブルには、重複する顧客番号が含まれているかもしれませんが、これは同じ顧客によって複数の取引が行われたためである可能性があります。

さまざまな種類の重複検査

Analytics では、次のような方法で重複を検査することができます。

テスト範囲 次の場合にはこのテストを使用します。
1 つのフィールド

特定フィールドのすべての値が一意である必要がある、たとえば、従業員番号や小切手番号など。

2 つ以上のフィールドの組み合わせ

各フィールドが分離した状態では一意性が要求されないが、フィールドを組み合わせた状態では一意性が要求される。

年間の給与支払ファイルでは、従業員番号フィールドと給料日フィールドはそれぞれ多くの重複を含んでいるでしょう。従業員は 2 週間ごとに給与が支払われ、複数の従業員が同じ日に給与を受け取ります。

ただし、個々の従業員は特定の日付に一度しか現れてはいけません。従業員番号と支払日を組み合わせて全体で重複が存在する場合、従業員が同じ給与期間に 2 回支払われている可能性があります。

レコードのすべてのフィールド

レコード内のすべてのフィールドが複製されている、全体が重複しているレコードを調べる。全体が重複しているレコードは、データの入力ミスの結果であるか、もしくは他の不正な取引行為の結果である可能性があります。

手順

重複する値や、全体が重複しているレコードが存在するかどうかを検出するために、アクティブなテーブル内の 1 つ以上のフィールドを検査することができます。

重複の削除

要約操作を使用して、データセットから重複値またはレコードを削除し、残った一意の値またはレコードを新しい Analytics テーブルに保存することができます。

Analytics 14.1 ヘルプ