PDF ファイルの定義
Adobe PDF ファイルを定義およびインポートして、Analytics テーブルを作成できます。
データ定義ウィザードを使用して PDF ファイルを処理するときには、Analytics がファイルのすべてまたは一部を自動的に定義する場合があります。あるいは、ファイルを手動で定義しなければならない場合があります。
メモ
PDF ファイルの定義は簡単ではありません。問題が発生した場合は、印刷イメージ(レポート)ファイルと PDF ファイルの定義を確認してください。
PDF ファイルの検索と選択
- [ ]の順にクリックします。
- [データ ソースのプラットフォームの選択]ページが表示されている場合は、[ローカル]を選択し、[次へ]をクリックします。
- [ローカル データ ソースの選択]ページで[ファイル]を選択し、[次へ]をクリックします。
- [定義するファイルの選択]ダイアログ ボックスで、Analytics テーブルの作成元とする PDF ファイルを探して選択し、[開く]をクリックします。
Adobe PDF ファイルのファイル拡張子は .pdf です。
- [ファイル形式]ページで、[PDF Adobe Acrobat ファイル]オプションを必ず選択し、[次へ]をクリックします。
PDF ファイルの定義
- [PDF ファイルの定義]ページで、必要に応じて、PDF ファイルのパスワードを入力し、[次へ]をクリックします。
- すべてのページではなく、解析対象の特定のページまたはページ範囲を指定する場合は、[ページ指定]を選択し、1 つ以上のページ番号を指定します。
カンマで区切られた個々のページ(1,3,5)、ページの範囲(2-7)、またはその組み合わせ(1, 3, 5-7, 11)を指定することができます。
ヒント
ある状況下においては、ページごとに PDF ファイルを解析すると、データの配置にずれが生じる場合があります。
この方法を使用する場合は、ファイルを 2 回以上インポートし、複数の Analytics テーブルを作成して、Analytics に作成したテーブルを追加する必要があります。
詳細については、印刷イメージまたは PDF データのサブセットの定義とインポートを参照してください。
- [PDF パーサー]はデフォルト設定の "Xpdf" にするか、"VeryPDF" を選択します。
初めてファイルをインポートし、特に理由がない場合は、設定を Xpdf のままにしてください。
ファイルで Xpdf を使用して、既にデータの整列に問題が発生している場合は、VeryPDF を選択して解析結果が改善されるか確認してください。
- [次へ]をクリックします。
PDF ファイルが解析されると[PDF ファイル定義]ページが更新され、解析されたファイルが表示されます。
- 上下左右にスクロールし、解析されたファイルを検証します。
強調表示は Analytics ではファイルに自動定義されたデータがあるかどうかを示します。
強調表示 意味 水色の強調表示 フィールドとして自動定義されたデータ。 灰色の強調表示 レコードして自動定義されたデータ。
レコード定義は、レコードで定義されている 1 つ以上のフィールドによって異なります。
白色の背景 未定義のデータ。
Analytics ではデータのパターンを検出できず、自動定義できませんでした。
- 省略可能。解析されたファイルのデータの配置がずれていた場合、[戻る]をクリックし、[PDF パーサー]でパーサー選択を切り替え、[次へ]をクリックします。
PDF ファイルは、選択したパーサーを使用して再解析されます。これにより、データの配置が向上する場合があります。
ファイルを再解析するときには、すべての既存のフィールドおよびレコード定義が削除されます。
- 次のいずれかを実行します。
自動定義の結果 対応 Analytics がファイルを自動定義し、更新する場合 Analytics がファイル全体を完全に自動定義し、次のことをしない場合 - 汎用フィールド名の更新
- ヘッダーまたはフッター データを詳細データに追加
に移動しますPDF ファイルの定義を確定する
Analytics がファイルを自動定義し、更新する場合 Analytics がファイル全体を完全に自動定義し、次のことをする場合 - 汎用フィールド名の更新 (“Field_1”、“Field_2” など)、移動します 自動定義の編集
- 詳細データにヘッダー データまたはフッター データを追加する場合は、進みます。 PDF ファイルの手動による定義
ヒント
データ定義ウィザードの次のページで汎用フィールド名を更新することもできます。この方が便利な場合があります。
自動定義にエラーが含まれる場合 自動定義 - にエラーが含まれる場合
- 必要なデータを除外します
- 必要ではないデータを含めます
次のいずれかを実行する必要があります。
- 自動定義の編集
- 自動定義全体の削除 PDF ファイルの手動による定義
ヒント
自動定義に重大なエラーが含まれる場合は、自動定義全体を削除し、ファイルを手動で定義する方が簡単な場合もあります。
解析されたファイルが完全に未定義の場合 解析されたファイルが完全に未定義の場合(白色の背景)、PDF ファイルの手動による定義
自動定義の編集
自動定義(または手動定義)を編集したい場合は、[PDF ファイルの定義]ページで次のいずれかを実行します。
タスクの編集 | 説明 |
---|---|
フィールド定義の編集 | 水色で強調表示されたフィールドを右クリックして、[フィールドの編集]を選択するか、フィールドをダブルクリックします。 次を含む多数の変更を行うことができます。
詳細については、フィールド定義での作業を参照してください。 |
レコード定義の編集 | 灰色のレコードを右クリックして、[レコードの編集]を選択するか、レコードをダブルクリックします。 2 つの主な変更を行うことができます。
詳細については、レコード定義での作業を参照してください。 |
フィールド定義またはレコード定義の削除 | フィールドまたはレコードを右クリックし、[フィールドの削除]または[レコードの削除]を選択します。 Analytics テーブルに必要がないフィールド、または自動定義でエラーが発生したために手動で定義したいフィールドの定義を削除できます。 レコード定義を削除する場合、レコードに含まれるすべてのフィールド定義も削除され、ファイルのレコード定義のすべてのインスタンスが削除されます。 メモ 削除しているのは、フィールド定義またはレコード定義のみであり、実際のデータを削除しているのではありません。必要に応じて、同じフィールドまたはレコード データを再定義できます。 ヒント レコードを選択して削除する場合は、[レコードの編集]を選択し、レコードのセットを取り込むために Analytics で使用される条件を微調整します。 詳細については、レコード定義での作業を参照してください。 |
PDF ファイルの手動による定義
ヒント
始める前に、クイック スタートの手順というスクリーン キャプチャー付きの以下の基本的な手順をまず確認すると役立つでしょう。
メモ
保存されているフィールドとレコード定義がある場合はこれらを使用すると、PDF ファイルを定義することもできます。
詳細については、保存されているフィールドとレコード定義のセットを使用した PDF ファイルの定義を参照してください。
- [PDF ファイル定義]ページで、データ値を選択し、テーブル内のフィールドの 1 つを定義することから始めます。
たとえば、SSN フィールドの社会保障番号を選択できます。データ値を選択するときには、[フィールド定義]ダイアログ ボックスが表示されます。
ガイドライン:
- データの任意の場所で値を選択できます。テーブルの最初のフィールドを使用したり、フィールドの最初の値を選択したりする必要はありません。
- 値には詳細データ、ヘッダー データ、またはフッター データを選択できます。
- フィールド名を選択しないでください。ソース ファイルのすべてのフィールド名は選択しないようにしてください。ソース ファイルのフィールド名を選択すると、Analytics はそのフィールド名を、フィールドに含まれるデータとして扱います。
- フィールド値の長さが異なる場合は、最も長い値を選択するか、あるいは余分な空白スペースを選択して、フィールドの低い位置にある可能性のある、現在表示されていない長い値に対応できるようにします。
初期データ値を使用して、レコードのセットを一意に識別する場合は、フィールド定義での作業を参照してください。
- フィールドの名前を入力し、必要に応じて、データ型を更新して、[OK]をクリックします。
- 選択したデータ値またはファイルの同じ行で、ソース ファイルのレコードのセットを一意に識別する文字または文字列を選択します。
たとえば次を選択します。
- 日付の値のスラッシュ
- 数値の小数点
- 選択したデータ値を含む行のいずれかの場所にある一意に識別可能な値
一意の文字を選択する場合は、[レコード定義]ダイアログ ボックスが開き、文字を含むすべてのレコードが灰色に強調表示されます。
詳細については、印刷イメージ(レポート)ファイルと PDF ファイルの定義を参照してください。
ソース ファイルで 1 行を超えているレコードを定義する必要がある場合は、複数行のレコードおよびフィールドの操作を参照してください。
- 必要に応じて、[レコード タイプ]を更新し、定義しているデータのタイプ(詳細、ヘッダー、またはフッター)に合わせます。
- 必要に応じて、レコードのセットを取り込むために使用する条件を変更します。
たとえば、別の条件を追加し、最初に取り込まれたレコードの一部を省略することができます。
詳細については、レコード定義での作業を参照してください。
- [OK]をクリックします。
定義したフィールドは水色で強調表示され、取り込まれたレコードの関連付けられたセットは灰色で強調表示されます。
- 上下にスクロールして、定義されたフィールドと、取り込まれたレコードの関連付けられたセットを検証します。
- フィールドが正しく定義されていない場合、または取り込まれたレコードのセットを調整する必要がある場合は、フィールドまたはレコードをダブルクリックし、[フィールド定義]ダイアログ ボックスまたは[レコード定義]ダイアログ ボックスで必要な編集を行います。
詳細については、フィールド定義での作業とレコード定義での作業を参照してください。
- 各フィールドの代表データ値を選択し、レコードの残りのフィールドを定義します。
追加フィールドは自動的にレコードのセットに適合します。
ガイドライン:
- 結果の Analytics テーブルで必要なフィールドのみを定義します。
- 各フィールド定義で上下にスクロールし、定義済みのフィールドを検証します。必要に応じて定義を編集します。
たとえば、データ値が完全にフィールドに含まれていない場合は、長さまたはフィールドの開始位置を調整する必要があります。
詳細については、自動定義の編集を参照してください。
- ソース ファイルで 1 行を超えているフィールド値を定義する必要がある場合は、複数行のレコードおよびフィールドの操作を参照してください。
ヒント詳細フィールドを定義する順序が、結果の Analytics テーブルに表示される順序になります。
定義処理中に詳細フィールドを削除して、もう一度追加すると、元の位置が失われ、詳細フィールドの最後に配置されます。
- 別のレコードを定義する場合は、手順の 1 ~ 9 を繰り返してください。
ガイドライン:
- データ値を選択し、レコードの新しいフィールドおよび関連付けられたセットの定義を開始するときには、表示されているダイアログ ボックスで[新規レコード]が選択されていることを確認し、[OK]をクリックします。
- ヘッダー レコードまたはフッター レコードは複数定義できますが、詳細レコードは 1 つしか定義できません。異なるレコード タイプを定義する順序は強制されません。
保存されているフィールドとレコード定義のセットを使用した PDF ファイルの定義
印刷イメージ クエリ ファイルに保存されている前のファイル定義セッションからのフィールドとレコードの定義を使用して、PDF ファイルを定義することができます。印刷イメージ クエリ ファイルはすでに存在している必要があり、保存されている定義は現行データと一致しなければなりません。
メモ
印刷イメージ クエリ ファイルを読み込むと、任意の現行のフィールドとレコードの定義が削除されます。
- [PDF ファイル定義]ページで[読み込み]をクリックします。
- 以前に保存されている印刷イメージ クエリ ファイルに移動してこれを選択し、[開く]をクリックします。
定義が現在のデータに適用されます。
印刷イメージ クエリ ファイルのファイル拡張子は .txt です。
メモ
現行データと一致する、またはほとんど一致することが分かっている定義のあるファイルのみを読み込んでください。
- ファイルの読み込み後、次のいずれかを実行します。
- ファイル全体が完全に定義されている場合PDF ファイルの定義を確定する に移動します
- ファイル定義の調整が必要な場合自動定義の編集
PDF ファイルの定義を確定する
- 省略可能。フィールドとレコード定義の現在のセットを保存する場合は、次のことを実行します。
- [保存]をクリックします。
- 印刷イメージ クエリ ファイルの名前を入力し、[保存]をクリックします。
メモ
フィールドとレコードの定義には多くの作業を要する場合が多くあります。そのためこれらを保存することをお勧めします。
インポートされたデータに調整が必要で、再定義、再インポートが必要であることが後で分かった場合は、保存されている定義はゼロから再び作成する必要はありません。
- すべてのフィールドおよびレコード定義が完了したら、[次へ]をクリックします。
メモ
必要であれば、ウィザードのこの時点に戻り、フィールドとレコードの定義を更新できます。
Analytics データ ファイルの保存
[データ ファイルを別名で保存]ダイアログ ボックスで、Analytics データ ファイルの名前を入力して[保存]をクリックします。
Analytics によってデータ ファイル名があらかじめ設定されている場合は、その設定されている名前を受け入れることも、あるいは変更することもできます。
Analytics によって開かれたデフォルトのロケーションを使用しない場合は、異なるフォルダーに移動して、データ ファイルを保存することもできます。
Analytics フィールド プロパティの編集
[フィールド プロパティの編集]ページで、Analytics によって、以下に一覧されたプロパティへと割り当てられた設定をレビューし、必要な更新を行い、[次へ]をクリックします。
メモ
列に関連付けられたプロパティを確認するには、プレビュー テーブルで列見出しを選択します。
プロパティ | 説明 |
---|---|
このフィールドを無視する | 結果として得られるテーブル レイアウトからフィールドを除外します。 このフィールドのデータは、インポートは行われますが、定義されないため、新しい Analytics テーブルには表示されません。必要に応じ、あとで定義して、テーブルに追加することができます。 |
名前 | テーブル レイアウトのフィールド名。 Analytics で割り当てた名前をそのまま使用するか、別の名前を入力します。 |
列見出し | デフォルトの Analytics ビューにおけるフィールドの列見出し。 列見出しを指定しない場合は、[名前]の値が使用されます。 |
型 | Analytics のフィールドに割り当てられるデータ型。 Analytics によって割り当てられたデータ型を保持するか、ドロップダウン リストから適切なデータ型を選択することができます。 Analytics でサポートされているデータ型の詳細については、Analytics データ型を参照してください。 |
値 | フィールドの最初の値を表示する読み取り専用プロパティ。 この値は、行う編集に基づき動的に更新します。 |
10 進型(Decimal) | 数値フィールドのみ。ソース データの小数点以下桁数。 メモ [小数位]テキスト ボックスは、数値のデータ型を選択すると自動的に表示されます。 |
入力形式 | 日付時刻フィールドのみ。ソース データの日付時刻値の書式。 指定する書式はソース データの書式と正確に一致する必要があります。 日付と時刻の書式の詳細については、ソース データに含まれる日付および時刻データの書式を参照してください。 |
インポートの最終処理
- [最終]ページで、新しい Analytics テーブルの設定を確認したら、[完了]をクリックします。
変更する場合は、[戻る]をクリックし、ウィザードの適切なページへと進みます。
- プロジェクトに追加中のテーブル名を入力するか、デフォルトの名前を保持し、そこで、[OK]をクリックします。
新しい Analytics テーブルは、インポートされたファイルからのデータと一緒に作成されます。