データの分析
「データの分析」は、さまざまなプロセスと手法を網羅する幅広い概念です。同じデータ分析目標を達成するためには、複数の方法がある場合があります。多くの場合、全体的なプロセスは反復的であり、作業途中で検出した情報に基づいて、初期アプローチを修正していくことが必要になります。
効果的なデータ分析
基本的に、データの分析とは、データに関する情報を見つけ出す処理です。Analytics は、分析を実行し、調査しているデータに関する一般的な洞察を得て、特定の問題に対して回答するために使用できる多数のコマンドおよび他のツールを提供します。ただし、Analytics で 2 つまたは 3 つのボタンをクリックするだけで、すべてのデータ分析の回答が魔法のように得られるということはありません。
効果的なデータ分析の要件:
- データの本質を理解する
- 特定の分析目標を策定する
- 十分な知識を持ってツールを応用する
Analytics は、データ分析機能を大幅に強化することはできますが、それらを置き換えることはしません。
Analytics のデータ分析コマンドとツール
以下の表は、データ分析領域別に、Analytics コマンドとツールを分類します。この分類は絶対的なものではありません。分類外でもコマンドを有効に使用できる場合があります。並べ替えや結合などの一部のコマンドは、主に分析的ではない主要な目的に対応しますが、状況によっては分析の洞察を提供することができます。
メモ
一般的に、基本事項以外に、データ分析では、単一のコマンドを分離して使用するのではなく、一連のコマンドを使用して、分析目標に向かって作業を進める必要があります。
データ分析領域 | コマンドまたはツール | 説明 |
---|---|---|
一般的な特性 |
これらのコマンドを使用して、次のようなデータセットの一般特性を検出します。
|
|
信頼性/正確性 | 演算フィールド | 演算フィールドを使用して、税込み合計金額などのデータセットの計算された金額の正確性を再計算およびテストします。 |
分離 |
フィルタリングを使用して、データセットまたはデータ処理を、関心があるレコードのサブセットに制限します 検索を使用して、データセットの特定の値を検索します |
|
順次的な順序 | 順番検査 | データが連続しているかどうかをテストし、順序から外れた項目を特定します |
完全性 | Gaps/ギャップ | 順次的な順序の一連の小切手など、連続するすべてのレコードが存在するかどうかを検証し、順番のギャップの場所を特定します |
一意性チェック | Duplicates/重複 | フィールドの重複値または項目、あるいは重複するレコード全体を特定します |
不正確さ | あいまい重複 | 同じ現実のエンティティを参照する可能性があるほぼ同一の値を特定します |
頻度分布 Materiality の集合化 |
レコードをグループ化し、数値範囲またはクラスター、期間、ロケーション コード、業者/顧客番号、または製品 ID などのレコード識別子によって集合化されるレコード数と値を決定します 異常値の特定でも役立ちます |
|
比較 | テーブルを結合し、請求書テーブルや PO テーブルなどのテーブル全体でレコードが一致しているか一致していないかどうかを検出します。 | |
数値の例外 | Benford(ベンフォード分析の実行) | 想定されるベンフォード分布からの差異の先頭の数字をテストし、例外の数値データを検出します |