Concept Information
Adobe PDF ファイルを定義およびインポートして、Analytics テーブルを作成します。
構文
IMPORT PDF TO table <PASSWORD 番号> インポート ファイル名 FROM ソース ファイル名 <SERVER プロファイル名> スキップ長さ <PARSER "VPDF"> <PAGES ページ範囲> {[レコード構文] [フィールド構文] <...n>} <...n>
レコード構文 ::=
RECORD レコード名 レコード タイプ レコードの行 透明 [テスト構文] <...n>
テスト構文 ::=
TEST 含める/除外する 一致タイプ AT 開始行,開始位置,範囲 論理 テキスト
フィールド構文 ::=
FIELD 名前 型 AT 開始行,開始位置 SIZE 長さ,フィールドの行 DEC 値 WID バイト PIC 形式 AS 表示名
パラメーター
一般パラメーター
名前 | 説明 |
---|---|
TO テーブル |
データをインポートする Analytics テーブルの名前。 メモ テーブルの名前は、64 文字までの英数字に制限されます。名前にはアンダースコア文字(_)を使用できますが、他の特殊文字やスペースは使用できません。名前の先頭を数字にすることはできません。 |
PASSWORD 番号 省略可能 |
パスワードで保護された PDF ファイルのパスワードに使用します。 使用するパスワード定義。 実際のパスワードを入力することを求めたり指定したりするのには、PASSWORD 番号の構文は使用しません。パスワード定義とは、以前に PASSWORD コマンドか SET PASSWORD コマンドを使用して入力または設定されたパスワードのことです。 番号はパスワード定義の番号です。たとえば、以前に 2 つのパスワードをスクリプトで設定したり入力したりしている場合、またはアナリティクス スクリプトをスケジュールしている場合、PASSWORD 2 により、2 番目のパスワードを使用することを指定します。 パスワードの入力または設定の詳細については、次を参照してください。 |
インポートファイル名 |
作成する Analytics データ ファイルの名前。 インポートファイル名、.FIL ファイル拡張子を持つ引用符で囲まれた文字列として指定します。例:"Invoices.FIL". デフォルトでは、データ ファイル(.FIL)は、Analytics プロジェクトが入っているフォルダーに保存されます。 既存の異なるフォルダーにデータ ファイルを保存するには、絶対または相対ファイル パスを指定します。
|
FROM ソースファイル名 |
ソース データ ファイルの名前。ソース ファイル名は引用符で囲む必要があります。 ソース データ ファイルが Analytics プロジェクトと同じフォルダーに位置しない場合、ファイルの位置を指定するために絶対パスまたは相対パスを使用する必要があります。
|
SERVER プロファイル名 省略可能 |
インポートするデータを含むサーバーのプロファイル名。 |
スキップする長さ
省略可能 |
ファイルの先頭でスキップするバイト数。 たとえば、先頭から 32 バイトにヘッダー情報が含まれている場合、この情報を除外するには、スキップする長さの値として 32 を指定します。 メモ Unicode データでは、偶数バイトのみを指定します。奇数のバイトを指定すると、インポートされたデータの後続の処理で問題が発生する可能性があります。 |
PARSER "VPDF" 省略可能 |
ファイル定義の処理時に VeryPDF パーサーを使用して、PDF ファイルを解析します。 PARSER を省略した場合は、デフォルトの Xpdf パーサーが使用されます。 初めて PDF ファイルをインポートし、特に理由がない場合は、デフォルトの Xpdf パーサーを使用してください。Xpdf を使用して、既にデータの整列に問題が発生している場合は、VeryPDF パーサーを使用して解析結果が改善されるか確認してください。 |
PAGES ページの範囲 省略可能 |
PDF ファイル内のすべてのページをインポートしない場合の、含めるページの範囲。ページの範囲は、引用符で囲んだ文字列として指定する必要があります。 以下を指定できます。
PAGES を省略する場合は、PDF ファイルのすべてのページがインポートされます。 |
RECORD パラメーター
一般レコード定義情報。
メモ
一部のレコード定義情報は、データ定義ウィザードのオプションにマッピングされる数値コードを使用して指定されます。
スクリプトでは、オプション名ではなく、数値コードを指定します。
名前 | 説明 |
---|---|
RECORD レコード名 |
データ定義ウィザードのレコード名。 IMPORT PDF コマンドでは、レコード名を指定する必要がありますが、レコード名値は結果の Analytics テーブルに表示されません。Analytics データ定義ウィザードでは、Analytics は、レコードのタイプに基づいて、デフォルト名を提供します。
デフォルト名を指定するか、別の名前を指定できます。 |
レコードのタイプ |
PDF ファイルを定義するときには、3 つのレコード タイプがあります。
メモ 単一の IMPORT PDF の実行では、複数のセットのヘッダーおよびフッター レコードを定義できますが、詳細レコードは 1 セットのみです。 |
レコードの行 |
PDF ファイルのレコードが占める行数。 PDF ファイルのデータと一致する単一行または複数行のレコードを定義します。 |
透明 |
ヘッダー レコードの透明設定。 メモ ヘッダー レコードにのみ適用されます。
透明なヘッダー レコードは複数行の詳細レコードに分割されません。 ヘッダー レコードがソース PDF ファイルの複数行の詳細レコードを分割する場合(改ページで発生する場合があります)、[1](透明)を指定すると、結果の Analytics テーブルの詳細レコードが統合されます。Analytics |
TEST パラメーター
PDF ファイルのレコードのセットを定義する条件。RECORD の各出現には、1 つ以上の TEST (8つまで) があります。
メモ
一部の条件は、データ定義ウィザードのオプション(オプション名は以下で括弧内に示されています)にマッピングされる数値コードを使用して指定されます。
スクリプトでは、オプション名ではなく、数値コードを指定します。
名前 | 説明 | ||||
---|---|---|---|---|---|
TEST 含める/除外する |
一致するデータを処理する方法:
|
||||
一致タイプ |
実行する一致のタイプ:
|
||||
AT 開始行, 開始位置, 範囲 |
|
||||
論理 |
条件間の論理関係:
|
||||
テキスト |
次に対して一致するリテラルまたはワイルドカード文字:
他の一致タイプについては、テキストは空の文字列 "" です。 |
FIELD パラメーター
フィールド定義情報。
名前 | 説明 | ||||
---|---|---|---|---|---|
FIELD 名前 型 |
インポートするソース データ ファイル内の個別フィールドの名前およびデータ型。フィールドをインポート対象から除外する場合は、そのフィールドを指定しないでください。 型については、フィールド データ型の識別子を参照してください。 |
||||
AT 開始行, 開始位置 |
|
||||
SIZE 長さ, フィールドの行 |
|
||||
DEC 値 |
数値フィールドの小数点以下の桁数 |
||||
WID バイト |
フィールドの表示幅(バイト数)。 指定した値によって、Analytics のビューおよびレポートにおけるフィールドの表示幅が決まります。表示幅はデータを変更するものではありませんが、表示幅がフィールド長より短い場合にはデータが隠れる可能性があります。 |
||||
PIC 書式 |
メモ 数値フィールドまたは日付時刻フィールドにのみ適用されます。
書式は引用符で囲む必要があります。 |
||||
AS 表示名 |
新しい Analytics テーブルのビューにおけるフィールドの表示名(代替列見出し)。 表示名の値は引用符で囲まれた文字列。列見出しを改行したい場合は、語句の間にセミコロン(;)を入れます。 フィールドの定義時には、AS は必須です。表示名をフィールド名と同じにしたい場合は、空の表示名を入力します。つまり、次の構文を使用します。AS ""2 つの二重引用符の間にスペースがないことを確認してください。 |
例
PDF ファイルの特定のページからデータをインポートする
次の例では、パスワードで保護された PDF ファイルVendors.pdf の 1 ページからデータをインポートしています。
詳細レコードの1 セットと 3 つのフィールドが、結果の Analytics テーブル Vendor_List に作成されます。Analytics
IMPORT PDF TO Vendor_List PASSWORD 1 "Vendor_List.FIL" FROM "Vendors.pdf" 2 PAGES "1" RECORD "Detail" 0 1 0 TEST 0 3 AT 1,1,0 7 "" FIELD "Vendor_Number" C AT 1,1 SIZE 10,1 DEC 0 WID 10 PIC "" AS "" FIELD "Vendor_Name" C AT 1,33 SIZE 58,1 DEC 0 WID 58 PIC "" AS "" FIELD "Last_Active_Date" D AT 1,277 SIZE 20,1 DEC 0 WID 20 PIC "DD/MM/YYYY" AS ""
備考
このコマンドの動作の詳細については、印刷イメージ(レポート)ファイルと PDF ファイルの定義とインポートを参照してください。
Analytics Unicode 版への PDF のインポートのトラブルシューティング
Analytics の Unicode 版を使って PDF ファイルをインポートする際に発生した問題は、長さの仕様に関連している可能性があります。
-
外国語の文字が突然表示されたり、結果の Analytics テーブルのレイアウトが歪んだりしている場合は、SIZE の長さを偶数に設定してください。Analytics
SIZE の長さに奇数のバイトを指定すると、インポートされたデータの処理で問題が発生する可能性があります。
- 作成する Analytics テーブルにレコードが含まれない場合、スキップするファイルの先頭にヘッダー データがあるときは、skip_length を 2Analytics またはその他の偶数に設定してみてください。
フィールド データ型の識別子
以下の表は、FIELD でデータ型を指定するときに使用する必要がある文字の一覧を示します。各文字は Analytics データ型の 1 つに対応します。
たとえば、文字データ型が必要な姓フィールドを定義する場合は、"C": FIELD "Last_Name" C と指定します。
詳細については、Analytics のデータ型を参照してください。
メモ
データ定義ウィザードを使用して EBCDIC、Unicode、または ASCII フィールドを含むテーブルを定義する場合、それらのフィールドには自動的に文字 "C"(CHARACTER 型)が割り当てられます。
IMPORT ステートメントを手作業で入力するか、既存の IMPORT ステートメントを編集する場合、EBCDIC または Unicode フィールドに対して、より特有の文字 "E" または "U" に置き換えることができます。
文字 |
Analytics データ型 |
---|---|
A |
ACL |
B |
BINARY |
C |
CHARACTER |
D |
DATETIME |
E |
EBCDIC |
F |
FLOAT |
G |
ACCPAC |
I |
IBMFLOAT |
K |
UNSIGNED |
L |
LOGICAL |
N |
|
P |
PACKED |
Q |
BASIC |
R |
MICRO |
S |
CUSTOM |
T |
PCASCII |
U |
UNICODE |
V |
VAXFLOAT |
X |
NUMERIC |
Y |
UNISYS |
Z |
ZONED |