CLUSTER コマンド

コンセプト情報

データのクラスター

1 つ以上の数値フィールドの類似した値に基づいて、レコードをクラスターにグループ化します。クラスターは単次元または多次元です。

メモ

Analytics を 32 ビット コンピューターで実行する場合は、CLUSTER コマンドはサポートされません。このコマンドに必要な演算は、プロセッサーの負荷が高いため、64 ビット コンピューターの方が適しています。

構文

CLUSTER ON キー フィールド <...n> KVALUE クラスター数 ITERATIONS 繰り返し数 INITIALIZATIONS 初期化数 <SEED シード値> <OTHER フィールド < ...n>> TO テーブル名 <IF テスト> <WHILE テスト> <FIRST 範囲|NEXT 範囲> OPEN {キーワードなし|NOCENTER|NOSCALE}

パラメーター

名前 説明
ON キー フィールド <...n>

クラスター化する 1 つ以上の数値フィールド。複数のフィールドはスペースで区切る必要があります。

KVALUE クラスター数

出力結果で生成されるクラスター数。

詳細については、クラスター数(K 値)の選択を参照してください。

ITERATIONS 繰り返し数 クラスター計算が再実行される最大回数。
INITIALIZATIONS 初期化数

ランダム中心の初期セットを生成する回数。

SEED シード値

省略可能

Analytics の乱数ジェネレーターを初期化するために使用するシード値。

SEED を省略した場合は、シード値がランダムに選択されます。

OTHER フィールド <...n> | OTHER ALL

省略可能

出力に含める 1 つ以上の追加フィールド。

  • OTHER フィールド<...n> 指定されたフィールドが含まれます

    フィールドはリストする順序で含まれます。

  • OTHER ALL はテーブルのすべてのフィールドに含まれます

    フィールドは、テーブル レイアウトに表示される順序で含まれます。

メモ

キー フィールドは自動的に出力フィールドに含まれます。ただし、NOSCALE を指定しないと、値が調整されます。OTHER を使用すると、2 番目の調整されていないキー フィールドを含めることができます。

TO テーブル名

コマンドの結果を送信する場所:

  • テーブル名は、結果の保存先となる Analytics テーブルのことです。

    テーブル名には、ファイル拡張子 .FIL を付けた文字列を引用符で囲んで指定する必要があります。例:TO "Output.FIL"

    デフォルトでは、テーブル データ ファイル(.fil)は、Analytics プロジェクトが入っているフォルダーに保存されます。

    既存の異なるフォルダーにデータ ファイルを保存するには、絶対または相対ファイル パスを指定します。

    • TO "C:\Output.FIL"
    • TO "Results\Output.FIL"

    メモ

    テーブル名は 64 文字の英数字(.FIL 拡張子を含まない)に制限されています。名前にはアンダースコア文字(_)を使用できますが、他の特殊文字やスペースは使用できません。名前の先頭を数字にすることはできません。

IF テスト

省略可能

各レコードを処理するために真である必要がある条件式。コマンドは、その条件を満たすレコードに対してのみ実行されます。

メモ

IF パラメーターは、任意の範囲パラメーター(WHILE、FIRST、NEXT)が適用された後に、テーブルに残るレコードに対してのみ評価されます。

WHILE テスト

省略可能

各レコードを処理するために真である必要がある条件式。条件が false と評価するか、テーブルの最後に達したら、コマンドは実行を中止します。

メモ

WHILE を FIRST または NEXT とともに使用する場合は、1 つの制限に達するとすぐに、レコードの処理が停止します。

FIRST 範囲 | NEXT 範囲

省略可能

処理するレコード数:

  • FIRST 指定されたレコード数に達するまで、最初のレコードから処理を開始します
  • NEXT 指定されたレコード数に達するまで、現在選択されているレコードから処理を開始します

範囲は処理するレコード数を指定します。

FIRST と NEXT を省略すると、すべてのレコードがデフォルトで処理されます。

OPEN

省略可能

コマンドを実行した後、コマンドによって作成されたテーブルを開きます。コマンドが出力テーブルを作成する場合にのみ有効です。

キーワードなし | NOCENTER | NOSCALE

クラスターを計算する前にキー フィールドの数値を前処理するメソッド。

  • キーワードなし キー フィールド値の中央を平均ゼロ(0)にし、標準偏差で除算して調整します。これは、値を z 得点相当(標準得点)に変換するプロセスです。
  • NOCENTER 標準偏差で除算してキー フィールド値を調整しますが、中央を平均ゼロ(0)にしません。
  • NOSCALE 元のキー フィールド値を使用します。中央合わせや調整は行いません。

詳細については、データ処理方法の指定を参照してください。

請求金額でのクラスター

Invoice_Amount フィールドで売掛金テーブルを階層化するほかに、同じフィールドでクラスター化することも決定します。

  • 階層化により、$1000 間隔などのあらかじめ定義された数値の境界を使用して、金額が階層にグループ化されます。
  • クラスターにより、前もって数値の境界を決定せずに、データに存在する金額の有機グループを検出します。
Open Ar
CLUSTER ON Invoice_Amount KVALUE 8 ITERATIONS 30 INITIALIZATIONS 10 OTHER No Due Date Ref Type TO "Clustered_invoices" NOSCALE

各出力クラスターに含まれるレコード数を簡単に検出する方法として、Clustered_invoices 出力テーブルを Cluster フィールドで分類します。

OPEN Clustered_invoices
CLASSIFY ON Cluster TO SCREEN

備考

このコマンドの動作の詳細については、データのクラスターを参照してください。