印刷イメージまたは PDF データのサブセットの定義とインポート

データが整列していないことが原因で、印刷イメージまたは PDF ファイルの完全なレコードのセットを定義することが難しいか不可能である場合は、ファイルからデータの複数のサブセットを定義してインポートできます。その後、Analytics で結果の Analytics テーブルを追加して、完全なデータ セットを作成できます。

データ定義ウィザードのソース ファイルに、レコードのブロックが含まれており、その中ですべてのフィールドが各ブロック内に配置される場合、この方法が最適です。データがより不規則に配置されている場合は、印刷イメージまたは PDF ファイルで整列していないフィールドの定義を参照してください。

ヒント:

PDF 定義の場合、ページごとに PDF ファイルを解析することができます。場合によっては、改ページをまたいでデータのずれが発生します。ページサイズのデータのサブセットを使用すると、整列の問題を解決できる場合があります。

印刷イメージまたは PDF データのサブセットを定義してインポートするには

  1. 通常の方法で、定義とインポート処理を実行します。ただし、次の違いがあります。

    同じファイルを複数回定義してインポートする

    各繰り返しで、レコードの異なるサブセットを定義します。各サブセットのフィールドは、内部的に整列している必要があります。

    レコードのサブセットは連続している必要はありません。たとえば、ファイルの開始および終了ではレコードのフィールドが互いに整列しているが、ファイルの中央にあるフィールドとは配置がずれている場合があります。

    各サブセットに含まれるレコードを追跡する方法を考える

    意図せずに同じレコードを複数回取り込んだ場合は、Analytics で再作成されたデータ セットから重複レコードを削除できます。詳細については、重複の削除を参照してください。

    各繰り返しで、データ構造が一貫していることを確認する

    名前、長さ、データ型、および対応するフィールドの順序が一貫していることを確認します。データ構造のこの一貫性を維持することで、結果 Analytics テーブルの追加が大幅に簡単になります。

    ヒント:

    最初のサブセットをインポートした後、Analytics で結果テーブルを開き、コマンドラインで「DISPLAY」と入力して、テーブル レイアウトのデータ構造を表示します。レコードとフィールドの後続のサブセットを作成するためのガイドとして、その表示されたテーブル レイアウト情報を使用します。

    作業を保存するには、レコードのサブセットを定義およびインポートするときに、Analytics における汎用フィールド名 ("Field_1"、"Field_2" など)を使用します。Analytics でデータ セットを再作成した時点で、再作成されたテーブルのすべてのフィールド名を変更できます。

  2. 各 Analytics データ ファイルと各 Analytics テーブル レイアウトを保存するときには、それぞれの名前の末尾に増分数字を付け、既に作成されたテーブルが上書きされないようにします。たとえば、"Table_1.fil"、"Table_2.fil" などです。
  3. ソース ファイルのすべてのレコードを定義およびインポートしたら、複数の Analytics テーブルを追加します。

    詳細については、データの抽出と追加を参照してください。

Analytics 14.1 ヘルプ