IMPORT PDF コマンド

Adobe PDF ファイルを定義およびインポートして、Analytics テーブルを作成します。

構文

IMPORT PDF TO table <PASSWORD 番号> インポート ファイル名 FROM ソース ファイル名 <SERVER プロファイル名> スキップ長さ <PARSER "VPDF"> <PAGES ページ範囲> {[レコード構文] [フィールド構文] <...n>} <...n>
レコード構文 ::=
RECORD レコード名 レコード タイプ レコードの行 透明 [テスト構文] <...n>
テスト構文 ::=
TEST 含める/除外する 一致タイプ AT 開始行,開始位置,範囲 論理 テキスト
フィールド構文 ::=
FIELD 名前  AT 開始行,開始位置 SIZE 長さ,フィールドの行 DEC  WID バイト PIC 形式 AS 表示名

パラメーター

一般パラメーター

名前 説明
TO テーブル

データをインポートする Analytics テーブルの名前。

メモ

テーブルの名前は、64 文字までの英数字に制限されます。 名前にはアンダースコア文字(_)を使用できますが、他の特殊文字やスペースは使用できません。 名前の先頭を数字にすることはできません。

PASSWORD 番号

省略可能

パスワードで保護された PDF ファイルのパスワードに使用します。

使用するパスワード定義。

実際のパスワードを入力することを求めたり指定したりするのには、PASSWORD 番号の構文は使用しません。 パスワード定義とは、以前に PASSWORD コマンドか SET PASSWORD コマンドを使用して入力または設定されたパスワードのことです。

番号はパスワード定義の番号です。 たとえば、以前に 2 つのパスワードをスクリプトで設定したり入力したりしている場合には、PASSWORD 2 により、2 番目のパスワードを使用することを指定するなどします。

パスワードの入力または設定の詳細については、次を参照してください。

インポートファイル名

作成する Analytics データ ファイルの名前。

インポートファイル名、.FIL ファイル拡張子を持つ引用符で囲まれた文字列として指定します。 例:"Invoices.FIL".

デフォルトでは、データ ファイル(.FIL)は、Analytics プロジェクトが入っているフォルダーに保存されます。

既存の異なるフォルダーにデータ ファイルを保存するには、絶対または相対ファイル パスを指定します。

  • "C:\data\Invoices.FIL"
  • "data\Invoices.FIL"

FROM ソースファイル名

ソース データ ファイルの名前。 ソース ファイル名は引用符で囲む必要があります。

ソース データ ファイルが Analytics プロジェクトと同じフォルダーに位置しない場合、ファイルの位置を指定するために絶対パスまたは相対パスを使用する必要があります。

  • "C:\data\ソース ファイル名"
  • "data\ソース ファイル名"
SERVER プロファイル名

省略可能

インポートするデータを含むサーバーのプロファイル名。
スキップする長さ

省略可能

ファイルの先頭でスキップするバイト数。

たとえば、先頭から 32 バイトにヘッダー情報が含まれている場合、この情報を除外するには、スキップする長さの値として 32 を指定します。

メモ

Unicode データでは、偶数バイトのみを指定します。 奇数のバイトを指定すると、インポートされたデータの後続の処理で問題が発生する可能性があります。

PARSER "VPDF"

省略可能

ファイル定義の処理時に VeryPDF パーサーを使用して、PDF ファイルを解析します。

PARSER を省略した場合は、デフォルトの Xpdf パーサーが使用されます。

初めて PDF ファイルをインポートし、特に理由がない場合は、デフォルトの Xpdf パーサーを使用してください。 Xpdf を使用して、既にデータの整列に問題が発生している場合は、VeryPDF パーサーを使用して解析結果が改善されるか確認してください。

PAGES ページの範囲

省略可能

PDF ファイル内のすべてのページをインポートしない場合の、含めるページの範囲。 ページの範囲は、引用符で囲んだ文字列として指定する必要があります。

以下を指定できます。

  • カンマで区切った個々のページ(1,3,5)
  • ページの範囲(2-7)
  • ページと範囲の組み合わせ(1, 3, 5-7, 11)

PAGES を省略する場合は、PDF ファイルのすべてのページがインポートされます。

RECORD パラメーター

一般レコード定義情報。

メモ

一部のレコード定義情報は、データ定義ウィザードのオプションにマッピングされる数値コードを使用して指定されます。

スクリプトでは、オプション名ではなく、数値コードを指定します。

名前 説明

RECORD レコード名

データ定義ウィザードのレコード名。

IMPORT PDF コマンドでは、レコード名を指定する必要がありますが、レコード名値は結果の Analytics テーブルに表示されません。

データ定義ウィザードでは、Analytics は、レコードのタイプに基づいて、デフォルト名を提供します。

  • 詳細
  • ヘッダーn
  • フッターn

デフォルト名を指定するか、別の名前を指定できます。

レコードのタイプ

PDF ファイルを定義するときには、3 つのレコード タイプがあります。

  • 0 – 詳細
  • 1 – ヘッダー
  • 2 – フッター

メモ

単一の IMPORT PDF の実行では、複数のセットのヘッダーおよびフッター レコードを定義できますが、詳細レコードは 1 セットのみです。

レコードの行

PDF ファイルのレコードが占める行数。

PDF ファイルのデータと一致する単一行または複数行のレコードを定義します。

透明

ヘッダー レコードの透明設定。

メモ

ヘッダー レコードにのみ適用されます。

  • 0 – 不透明
  • 1 – 透明

透明なヘッダー レコードは複数行の詳細レコードに分割されません。

ヘッダー レコードがソース PDF ファイルの複数行の詳細レコードを分割する場合(改ページで発生する場合があります)、[1](透明)を指定すると、結果の Analytics テーブルの詳細レコードが統合されます。

TEST パラメーター

PDF ファイルのレコードのセットを定義する条件。 RECORD の各出現には、1 つ以上の TEST (8つまで) があります。

メモ

一部の条件は、データ定義ウィザードのオプション(オプション名は以下で括弧内に示されています)にマッピングされる数値コードを使用して指定されます。

スクリプトでは、オプション名ではなく、数値コードを指定します。

名前 説明
TEST 含める/除外する

一致するデータを処理する方法:

  • 0 – (含める) 条件を満たすデータがレコードのセットに含まれます
  • 1 – (除外する) 条件を満たすデータがレコードのセットから除外されます
一致タイプ

実行する一致のタイプ:

  • 0 – (正確に一致する) 一致するレコードには、指定された文字または文字列が、指定された位置で始まる、指定された開始行に含まれている必要があります。
  • 2 – (英文字) 一致するレコードには、指定された開始行の指定された開始位置にあるか、指定された範囲のすべての位置にある 1 つ以上の英文字を含んでいる必要があります。
  • 3 – (数字) 一致するレコードには、指定された開始行の指定された開始位置にあるか、指定された範囲のすべての位置にある 1 つ以上の数字を含んでいる必要があります。
  • 4 – (空白) 一致するレコードには、指定された開始行の指定された開始位置にあるか、指定された範囲のすべての位置にある 1 つ以上の空白を含んでいる必要があります。
  • 5 – (空白以外) 一致するレコードには、指定された開始行の指定された開始位置にあるか、指定された範囲のすべての位置にある 1 つ以上の空白以外の文字(特殊文字を含む)を含んでいる必要があります。
  • 7 – (行で検索) 一致するレコードには、指定された文字または文字列が、指定された位置で始まる、指定された開始行に含まれている必要があります。
  • 8 – (範囲で検索) 一致するレコードには、[テキスト]フィールドにある文字または文字列が、指定された範囲の、レコードの指定された行の指定された範囲のどこかに含まれている必要があります。
  • 10 – (独自のマップ) 一致するレコードには、指定された文字パターンと一致する文字が、指定された位置で始まる、指定された開始行に含まれている必要があります。
AT 開始行, 開始位置, 範囲
  • 開始行条件が適用されるレコードの行

    たとえば、独自のマップを使用して郵便番号と一致させ、郵便番号が 3 行レコードの 3 行目に表示される場合は、[開始行]で 3 を指定する必要があります。

    メモ

    単一行のレコードの場合、開始行の値は常に 1 です。

  • 開始位置条件と比較する PDF ファイルの開始バイト位置
  • 範囲条件との比較で使用する PDF ファイルの開始バイト位置からのバイト数

    範囲なしで開始バイト位置のみを使用している場合は、範囲0 を指定します。

    メモ

    非 Unicode 版 Analytics1 バイト = 1 文字
    Unicode 版 Analytics2 バイト = 1 文字
論理

条件間の論理関係:

  • 0 – (And) 現在および次の条件は、論理 AND に関連しています
  • 1 – (Or) 現在および次の条件は、論理 OR に関連しています
  • 4 – (新しいグループ > And) 現在の条件は論理条件のグループの最後です。現在のグループと次のグループは、論理 AND で関連付けられます。
  • 5 – (新しいグループ > Or) 現在の条件は論理条件のグループの最後です。現在のグループと次のグループは、論理 OR で関連付けられます。
  • 7 – (終了) 現在の条件は論理条件のグループの最後です。
テキスト

次に対して一致するリテラルまたはワイルドカード文字:

  • 正確に一致する]、[行で検索]、または[範囲で検索]の場合、PDF ファイルのレコードのセットを一意に識別する文字または文字列を指定します。
  • 独自のマップ]の場合、PDF ファイルのレコードのセットを一意に識別する文字パターンを指定します。

    カスタム マップオプションは、MAP( ) 関数と同じ構文を使用します。

他の一致タイプについては、テキストは空の文字列 "" です。

FIELD パラメーター

フィールド定義情報。

名前 説明
FIELD 名前

インポートするソース データ ファイル内の個別フィールドの名前およびデータ型。 フィールドをインポート対象から除外する場合は、そのフィールドを指定しないでください。

については、フィールド データ型の識別子を参照してください。

AT 開始行, 開始位置
  • 開始行PDF ファイルのレコードのフィールドの開始行

    PDF ファイルの複数行のレコードの場合、開始行はレコードの任意の行でフィールドを開始できます。 レコードの行1 の場合、開始行は常に 1 です。

  • 開始位置 PDF ファイルのフィールドの開始バイト位置

    メモ

    非 Unicode 版 Analytics1 バイト = 1 文字
    Unicode 版 Analytics2 バイト = 1 文字

    Unicode 版 Analytics では、一般的に、奇数で開始するバイト位置を指定してください。 偶数の開始位置を指定すると、文字が正しく表示されない可能性があります。

SIZE 長さ, フィールドの行
  • 長さ Analytics テーブル レイアウトにおけるフィールドの長さ(バイト数)

    メモ

    非 Unicode 版 Analytics 1 バイト = 1 文字
    Unicode 版 Analytics 2 バイト = 1 文字

    Unicode 版 Analytics では、偶数バイトのみを指定します。 奇数バイトを指定すると、文字が正しく表示されない可能性があります。

  • lフィールドの行PDF ファイルの単一フィールド値が占める行数

    ファイルのデータと一致する単一行または複数行のフィールドを定義できます。

    メモ

    フィールドに指定された行数は、フィールドを含むレコードに指定された行数を超えることができません。

DEC

数値フィールドの小数点以下の桁数

WID バイト

フィールドの表示幅(バイト数)。

指定した値によって、Analytics のビューおよびレポートにおけるフィールドの表示幅が決まります。 表示幅はデータを変更するものではありませんが、表示幅がフィールド長より短い場合にはデータが隠れる可能性があります。

PIC 書式

メモ

数値フィールドまたは日付時刻フィールドにのみ適用されます。

  • 数値フィールド Analytics のビューとレポートに含まれる数値の表示形式。
  • 日付時刻フィールドソース データの日付時刻値の物理形式(日付時刻文字、区切り文字の順など)

    メモ

    日付時刻フィールドの場合、形式はソース データの物理形式と正確に一致する必要があります。 たとえば、ソース データが 12/31/2014 である場合は、書式を "MM/DD/YYYY" として入力します。

書式は引用符で囲む必要があります。

AS 表示名

新しい Analytics テーブルのビューにおけるフィールドの表示名(代替列見出し)。

表示名の値は引用符で囲まれた文字列。 列見出しを改行したい場合は、語句の間にセミコロン(;)を入れます。

フィールドの定義時には、AS は必須です。 表示名をフィールド名と同じにしたい場合は、空の表示名を入力します。つまり、次の構文を使用します。AS "" 2 つの二重引用符の間にスペースがないことを確認してください。

PDF ファイルの特定のページからデータをインポートする

次の例では、パスワードで保護された PDF ファイルVendors.pdf の 1 ページからデータをインポートしています。

詳細レコードの1 セットと 3 つのフィールドが、結果の Analytics テーブル Vendor_List に作成されます。

IMPORT PDF TO Vendor_List PASSWORD 1 "Vendor_List.FIL" FROM "Vendors.pdf" 2 PAGES "1" RECORD "Detail" 0 1 0 TEST 0 3 AT 1,1,0 7 "" FIELD "Vendor_Number" C AT 1,1 SIZE 10,1 DEC 0 WID 10  PIC "" AS "" FIELD "Vendor_Name" C AT 1,33 SIZE 58,1 DEC 0 WID 58  PIC "" AS "" FIELD "Last_Active_Date" D AT 1,277 SIZE 20,1 DEC 0 WID 20  PIC "DD/MM/YYYY" AS ""

備考

メモ

このコマンドの動作の詳細については、Analytics のヘルプを参照してください。

Analytics Unicode 版への PDF のインポートのトラブルシューティング

Analytics の Unicode 版を使って PDF ファイルをインポートする際に発生した問題は、長さの仕様に関連している可能性があります。

  • 外国語の文字が突然表示されたり、結果の Analytics テーブルのレイアウトが歪んだりしている場合は、SIZE の長さを偶数に設定してください。

    SIZE の長さに奇数のバイトを指定すると、インポートされたデータの処理で問題が発生する可能性があります。

  • 作成する Analytics テーブルにレコードが含まれない場合、スキップするファイルの先頭にヘッダー データがあるときは、skip_length 2 またはその他の偶数に設定してみてください。

フィールド データ型の識別子

以下の表は、FIELD でデータを指定するときに使用する必要がある文字の一覧を示します。 各文字は Analytics データ型の 1 つに対応します。

たとえば、文字データ型が必要な姓フィールドを定義する場合は、"C": FIELD "Last_Name" C と指定します。

詳細については、Analytics データ型を参照してください。

メモ

データ定義ウィザードを使用して EBCDIC、Unicode、または ASCII フィールドを含むテーブルを定義する場合、それらのフィールドには自動的に文字 "C"(CHARACTER 型)が割り当てられます。

IMPORT ステートメントを手作業で入力するか、既存の IMPORT ステートメントを編集する場合、EBCDIC または Unicode フィールドに対して、より特有の文字 "E" または "U" に置き換えることができます。

文字

Analytics データ型

A

ACL

B

BINARY

C

CHARACTER

D

DATETIME

E

EBCDIC

F

FLOAT

G

ACCPAC

I

IBMFLOAT

K

UNSIGNED

L

LOGICAL

N

PRINT

P

PACKED

Q

BASIC

R

MICRO

S

CUSTOM

T

PCASCII

U

UNICODE

V

VAXFLOAT

X

NUMERIC

Y

UNISYS

Z

ZONED