IMPORT PDF-Befehl

Erstellt eine Analytics-Tabelle, indem eine Adobe-PDF-Datei definiert und importiert wird.

Syntax

IMPORT PDF TO Tabelle <PASSWORD Zahl> Importdateiname FROM Quelldateiname <SERVER Profilname> Anzahl zu überspringender Bytes <PARSER "VPDF"> <PAGES Seitenbereich> {[Datensatzsyntax] [Feldsyntax] <...n>} <...n>
Datensatzsyntax ::=
RECORD Datensatzname Datensatztyp Zeilen_in_Datensatz transparent [Testsyntax] <...n>
Testsyntax ::=
TEST Einschließen_Ausschließen Übereinstimmunsgtyp AT Startzeile;Startposition;Bereich Logik Text
Feldsyntax ::=
FIELD Name Typ AT Startzeile;Startposition SIZE Länge;Zeilen_in_Feld DEC Wert WID Bytes PIC Format AS Anzeigename

Parameter

Allgemeine Parameter

Name Beschreibung
TO Tabelle

Der Name der Analytics-Tabelle, in welche die Daten importiert werden sollen.

Hinweis

Tabellennamen sind auf 64 alphanumerische Zeichen beschränkt. Der Name kann den Unterstrich beinhalten ( _ ), aber keine anderen Sonderzeichen oder Leerzeichen. Er kann nicht mit einer Ziffer beginnen.

PASSWORD Zahl

Optional

Wird für kennwortgeschützte PDF-Dateien verwendet.

Die zu verwendende Kennwortdefinition.

Sie verwenden nicht PASSWORD Zahl, um ein tatsächliches Kennwort abzurufen oder festzulegen. Die Kennwortdefinition bezieht sich auf ein vorher angegebenes oder ein mit dem PASSWORD-, dem SET-PASSWORD-Befehl oder dem PASSWORD-Analysetag festgelegtes Kennwort.

Zahl bezieht sich auf die Zahl der Kennwortdefinition. Wenn beispielsweise zuvor zwei Kennwörter in einem Skript angegeben bzw. festgelegt wurden oder falls eine Analyse geplant wurde, wird mit PASSWORD 2 angegeben, dass das zweite Kennwort verwendet wird.

Weitere Informationen über die Angabe oder das Festlegen von Kennwörtern finden Sie unter:

Importdateiname

Der Name der zu erstellenden Analytics-Datendatei.

Geben Sie Importdateiname als in Anführungszeichen gesetzte Zeichenfolge mit der Dateierweiterung „.FIL“ an. Zum Beispiel: „Rechnungen.FIL“.

Standardmäßig wird die Datendatei (.FIL) in den Ordner mit dem Analytics-Projekt gespeichert.

Verwenden Sie entweder einen absoluten oder relativen Dateipfad, um die Datendatei in einen anderen bestehenden Ordner zu speichern:

  • "C:\Daten\Rechnungen.FIL"
  • "Daten\Rechnungen.FIL"

FROM Quelldateiname

Der Name der Quelldatendatei. Quelldateiname muss eine in Anführungszeichen gesetzte Zeichenfolge sein.

Wenn sich die Quelldatendatei nicht im selben Verzeichnis wie das Analytics-Projekt befindet, muss der Dateispeicherort mit einem absoluten Pfad oder relativen Pfad angegeben werden:

  • "C:\Daten\Quelldateiname"
  • "Daten\Quelldateiname"
SERVER Profilname

Optional

Der Profilname des Servers, der die zu importierenden Daten beinhaltet.
Überspringe_Länge

Optional

Anzahl der Bytes, die am Anfang der Datei übersprungen werden.

Wenn die ersten 32 Bytes beispielsweise Kopfzeileninformationen enthalten, können Sie den Wert „32“ angeben, damit diese Informationen ausgelassen werden.

Hinweis

Legen Sie für Unicode-Daten nur eine gerade Anzahl von Bytes fest. Die Angabe einer ungeraden Byte-Anzahl kann bei der späteren Verarbeitung der Daten Probleme verursachen.

PARSER "VPDF"

Optional

Den VeryPDF-Parser zur Analyse der PDF-Datei während der Dateidefinition verwenden.

Wenn Sie PARSER nicht angeben, wird der standardmäßige Xpdf-Parser verwendet.

Wenn Sie erstmals eine PDF-Datei importieren und keinen Grund für eine Änderung haben, verwenden Sie den Standard-Xpdf-Parser. Falls während der Verwendung von Xpdf bereits Probleme mit der Datenausrichtung auftraten, verwenden Sie den VeryPDF-Parser, um zu sehen, ob die Auswertungsergebnisse dadurch verbessert werden.

PAGES Seitenbereich

Optional

Die einzuschließenden Seiten, wenn Sie nicht alle Seiten der PDF-Datei importieren möchten. Seitenbereich muss als eine in Anführungszeichen gesetzte Zeichenfolge angegeben werden.

Sie können Folgendes festlegen:

  • einzelne Seiten, die durch Kommas getrennt sind (1,3,5)
  • Seitenbereiche (2-7)
  • Kombination aus Seiten und Bereichen (1, 3, 5-7, 11)

Wenn Sie PAGES nicht angeben, werden alle Seiten der PDF-Datei importiert.

RECORD-Parameter

Allgemeine Informationen für die Datensatzdefinition.

Hinweis

Einige Informationen der Datensatzdefinition werden mit numerischen Codes festgelegt, die Optionen im Assistenten für Datendefinition zugeordnet sind.

In Skripts geben Sie den numerischen Code und nicht den Optionsnamen an.

Name Beschreibung

RECORD Datensatzname

Der Name des Datensatzes im Assistent für Datendefinition.

Für den Befehl „IMPORT PDF“ müssen Sie Datensatzname angeben. Der Wert von Datensatzname erscheint aber nicht in der entstehenden Analytics-Tabelle.

Im Assistent für Datendefinition gibt Analytics Standardnamen auf Basis des Datensatztyps an:

  • Einzeldatensatz
  • Kopfzeilen
  • Fußzeilen

Sie können die Standardnamen verwenden oder andere Namen festlegen.

Datensatztyp

Die drei möglichen Datensatztypen für die Definition einer PDF-Datei:

  • 0 – Detail
  • 1 – Kopfzeile
  • 2 – Fußzeile

Hinweis

Sie können für eine einzelne Ausführung von IMPORT PDF mehrere Kopf- und Fußzeilendatensätze, aber nur eine Menge an Detaildatensätzen definieren.

Zeilen_in_Datensatz

Die Anzahl an Zeilen, die ein Datensatz in der PDF-Datei einnimmt.

Sie können einzeilige oder mehrzeilige Datensätze entsprechend den Daten in der PDF-Datei definieren.

transparent

Die Transparenzeinstellung für einen Kopfzeilendatensatz.

Hinweis

Nur anwendbar auf Kopfzeilendatensätze.

  • 0 – nicht transparent
  • 1 – transparent

Transparente Kopfzeilendatensätze teilen mehrzeilige Detaildatensätze nicht auf.

Wenn ein Kopfzeilendatensatz einen mehrzeiligen Detaildatensatz in der PDF-Quelldatei aufteilt, was bei einem Seitenumbruch geschehen kann, wird der Detaildatensatz durch die Auswahl von 1 (transparent) in der sich ergebenden Analytics-Tabelle wieder vereint.

TEST-Parameter

Die Kriterien für die Definition einer Datensatzmenge in der PDF-Datei. Für jedes Auftreten von RECORD kann TEST ein- oder mehrmals (bis zu achtmal) vorkommen.

Hinweis

Einige Kriterien werden mit numerischen Codes festgelegt, die Optionen im Assistenten für Datendefinition zugeordnet sind (Optionsnamen werden unten in Klammern dargestellt).

In Skripts geben Sie den numerischen Code und nicht den Optionsnamen an.

Name Beschreibung
TEST Einschließen_Ausschließen

Wie übereinstimmende Daten zu behandeln sind:

  • 0 – (Einschließen) Daten, welche die Kriterien erfüllen, werden in die Datensatzmenge aufgenommen.
  • 1 – (Ausschließen) Daten, welche die Kriterien erfüllen, werden nicht in die Datensatzmenge aufgenommen.
Übereinstimmungstyp

Die Art des durchzuführenden Abgleichs:

  • 0 – (Genauer Vergleich) Übereinstimmende Datensätze müssen das angegebene Zeichen oder die Zeichenfolge in der angegebenen Startzeile an der festgelegten Position aufweisen.
  • 2 – (Alpha) Übereinstimmende Datensätze müssen ein oder mehrere Buchstaben in der angegebenen Startzeile an der festgelegten Startposition oder an allen Positionen des festgelegten Bereichs aufweisen.
  • 3 – (Numerisch) Übereinstimmende Datensätze müssen ein oder mehrere numerische Zeichen in der angegebenen Startzeile an der festgelegten Startposition oder an allen Positionen des festgelegten Bereichs aufweisen.
  • 4 – (Leer) Übereinstimmende Datensätze müssen ein oder mehrere Leerräume in der angegebenen Startzeile an der festgelegten Startposition oder an allen Positionen des festgelegten Bereichs aufweisen.
  • 5 – (Nicht Leer) Übereinstimmende Datensätze müssen ein oder mehrere nicht leere Zeichen (einschließlich Sonderzeichen) in der angegebenen Startzeile an der festgelegten Startposition oder an allen Positionen des festgelegten Bereichs aufweisen.
  • 7 – (Suchen in Zeile) Übereinstimmende Datensätze müssen das angegebene Zeichen oder die Zeichenfolge irgendwo in der angegebenen Startzeile aufweisen.
  • 8 – (Suchen in Bereich) Übereinstimmende Datensätze müssen das angegebene Zeichen oder die Zeichenfolge in der Startzeile irgendwo im angegebenen Bereich aufweisen.
  • 10 – (Benutzerdefinition) Übereinstimmende Datensätze müssen Zeichen, die dem angegebenen Zeichenmuster entsprechen, in der angegebenen Startzeile ab der festgelegten Position aufweisen.
AT Startzeile; Startposition; Bereich
  • Startzeile die Zeile eines Datensatzes, auf die die Kriterien angewendet werden

    Falls Sie beispielsweise ein benutzerdefiniertes Muster zur Übereinstimmung mit Postleitzahlen erstellen und die Postleitzahlen in der dritten Zeile eines Adressdatensatzes aus drei Zeilen erscheinen, müssen Sie für Startzeile den Wert 3 eingeben.

    Hinweis

    Bei einzeiligen Datensätzen lautet Startzeile stets 1.

  • Startposition die Startposition in Bytes in der PDF-Datei, ab der Kriterien verglichen werden sollen
  • Bereich die Anzahl an Bytes ab der Byte-Startposition in der PDF-Datei, für die die Kriterien verglichen werden sollen

    Wenn Sie nur die Startposition in Bytes ohne einen Bereich verwenden, geben Sie 0 für Bereich ein.

    Hinweis

    Nicht-Unicode-Analytics1 Byte = 1 Zeichen
    Unicode-Analytics2 Bytes = 1 Zeichen
Logik

Die logischen Beziehungen zwischen Kriterien:

  • 0 – (Und) Das aktuelle und das nächste Kriterium werden mit einem logischen AND verbunden.
  • 1 – (Oder) Das aktuelle und das nächste Kriterium werden mit einem logischen OR verbunden.
  • 4 – (Neue Gruppe > Und) Das aktuelle Kriterium ist das letzte Kriterium in einer Gruppe logischer Kriterien, wobei die aktuelle und die nächste Gruppe mit einem logischen AND verbunden werden.
  • 5 – (Neue Gruppe > Oder) Das aktuelle Kriterium ist das letzte Kriterium in einer Gruppe logischer Kriterien, wobei die aktuelle und die nächste Gruppe mit einem logischen OR verbunden werden.
  • 7 – (Ende) Das aktuelle Kriterium ist das letzte Kriterium in einer Gruppe logischer Kriterien.
Text

Literale oder Platzhalterzeichen, die abgeglichen werden:

  • Für „Genauer Vergleich“, „Suchen in Zeile“ oder „Suchen in Bereich“ Gibt das Zeichen oder die Zeichenfolge an, um die Datensatzmenge in der PDF-Datei eindeutig zu identifizieren.
  • Für „Benutzerdefinition“ Gibt das Zeichenmuster an, um die Datensatzmenge in der PDF-Datei eindeutig zu identifizieren.

    Die Option Benutzerdefinition verwendet dieselbe Syntax wie MAP( )-Funktion.

Für andere Übereinstimmungstypen ist Text eine leere Zeichenfolge "".

FIELD-Parameter

Felddefinitionsinformationen.

Name Beschreibung
FIELD Name Typ

Die zu importierenden einzelnen Felder der Quelldatendatei sowie der Name und der Datentyp des Felds. Damit ein Feld nicht importiert wird, geben Sie es an dieser Stelle nicht an.

Informationen zum Typ finden Sie unter Bezeichner für Felddatentypen.

AT Startzeile; Startposition
  • Startzeile die Startzeile für das Feld im Datensatz der PDF-Datei

    Für mehrzeilige Datensätze in einer PDF-Datei ermöglicht Ihnen Startzeile, ein Feld in einer beliebigen Zeile des Datensatzes zu beginnen. Startzeile ist immer 1, falls Zeilen_in_Datensatz 1 ist.

  • Startposition Die Byte-Startposition des Felds innerhalb der PDF-Datei

    Hinweis

    Nicht-Unicode-Analytics1 Byte = 1 Zeichen
    Unicode-Analytics2 Bytes = 1 Zeichen

    In Unicode-Analytics sollten Sie in der Regel eine ungerade Byte-Startposition festlegen. Wenn Sie eine gerade Startposition festlegen, werden Zeichen unter Umständen falsch angezeigt.

SIZE Länge; Zeilen_im_Feld
  • Länge Die Feldlänge in Bytes im Analytics-Tabellenlayout

    Hinweis

    Nicht-Unicode-Analytics 1 Byte = 1 Zeichen
    Unicode-Analytics 2 Bytes = 1 Zeichen

    Legen Sie in Unicode-Analytics nur eine gerade Anzahl von Bytes fest. Wenn Sie eine ungerade Anzahl von Bytes festlegen, werden Zeichen unter Umständen falsch angezeigt.

  • Zeilen_im_Feld die Anzahl an Zeilen, die ein einzelner Feldwert in der PDF-Datei einnimmt

    Sie können einzeilige oder mehrzeilige Felder entsprechend den Daten in der-Datei definieren.

    Hinweis

    Die für ein Feld angegebene Zeilenanzahl darf nicht die für den Datensatz des Felds angegebene Zeilenanzahl übersteigen.

DEC Wert

Die Anzahl der Dezimalstellen für numerische Felder.

WID Bytes

Die Anzeigebreite des Felds in Bytes.

Der festgelegte Wert steuert die Anzeigebreite des Felds in Analytics-Ansichten und -Berichten. Die Anzeigebreite ändert niemals Daten, sie kann aber Daten verbergen, falls sie unter der Feldlänge liegt.

PIC Format

Hinweis

Gilt nur für numerische Felder oder Datumzeit-Felder.

  • Numerische Felder das Anzeigeformat von numerischen Werten in Analytics-Ansichten und -Berichten
  • Datumzeit-Felder das physische Format der Datumzeit-Werte in den Quelldaten (Reihenfolge von Datum- und Zeitzeichen, Trennzeichen usw.)

    Hinweis

    Bei Datumzeit-Feldern muss Format genau dem physischen Format der Quelldaten entsprechen. Wenn die Quelldaten beispielsweise „12/31/2014“ enthalten, müssen Sie das Format als "MM/TT/JJJJ" eingeben.

Format muss in Anführungszeichen gesetzt werden.

AS Anzeigename

Der Anzeigename (alternative Spaltentitel) für das Feld in der Ansicht der neuen Analytics-Tabelle.

Geben Sie den Anzeigenamen als in Anführungszeichen gesetzte Zeichenfolge an. Verwenden Sie zwischen den Wörtern ein Semikolon (;), wenn Sie die Zeilen in dem Spaltentitel umbrechen möchten.

AS wird zur Definition von FIELD benötigt. Damit der Anzeigename mit dem Feldnamen identisch ist, geben Sie für Anzeigename einen leeren Wert mit der folgenden Syntax ein: AS "". Stellen Sie sicher, dass sich zwischen den beiden doppelten Anführungszeichen kein Leerzeichen befindet.

Beispiele

Daten von einer bestimmten Seite einer PDF-Datei importieren

Sie importieren Daten von Seite 1 einer kennwortgeschützten PDF-Datei namens Lieferanten.pdf:

In der sich ergebenden Analytics-Tabelle mit dem Namen Lieferantenliste werden Detaildatensätze mit drei Feldern erstellt:

IMPORT PDF TO Lieferantenliste PASSWORD 1 "Lieferantenliste.FIL" FROM "Lieferanten.pdf" 2 PAGES "1" RECORD "Detail" 0 1 0 TEST 0 3 AT 1;1;0 7 "" FIELD "Lieferantennummer" C AT 1;1 SIZE 10;1 DEC 0 WID 10  PIC "" AS "" FIELD "Lieferantenname" C AT 1;33 SIZE 58;1 DEC 0 WID 58  PIC "" AS "" FIELD "Letztes_aktives_Datum" D AT 1;277 SIZE 20;1 DEC 0 WID 20  PIC "TT/MM/JJJJ" AS ""

Bemerkungen

Weitere Informationen über die Funktionsweise dieses Befehls finden Sie unter Druckdateien (Berichte) und PDF-Dateien definieren und importieren.

Problembehandlung von PDF-Importen in der Unicode-Edition von Analytics

Wenn es beim Import einer PDF-Datei innerhalb der Unicode-Edition von Analytics Probleme gibt, könnte dies an Längenangaben liegen:

  • Falls unerwartet Zeichen einer Fremdsprache erscheinen oder das Layout der sich ergebenden Analytics-Tabelle verzerrt ist, sollten Sie überprüfen, ob die Länge in SIZE auf eine gerade Zahl eingestellt ist.

    Die Angabe einer ungeraden Byte-Anzahl für die Länge in SIZE kann bei der Verarbeitung der importierten Daten Probleme verursachen.

  • Wenn die Analytics-Tabelle erstellt wurde, aber keinerlei Datensätze enthält, versuchen Sie die Anzahl zu überspringender Bytes auf 2 oder eine andere gerade Zahl einzustellen, falls es am Beginn der Datei Kopfdaten gibt, die Sie überspringen möchten.

Bezeichner für Felddatentypen

Die folgende Tabelle enthält die Buchstaben, die Sie zur Angabe des Typs für FIELD festlegen müssen. Jeder Buchstabe entspricht einem Analytics-Datentyp.

Wenn Sie beispielsweise ein Feld „Nachname“ definieren, das einen Zeichendatentyp benötigt, würden Sie „C“ festlegen: FIELD "Nachname" C.

Weitere Informationen finden Sie unter Datentypen in Analytics.

Hinweis

Wenn Sie eine Tabelle mit dem Assistent für Datendefinition definieren, die EBCDIC-, Unicode- oder ASCII-Felder enthält, wird den Feldern automatisch der Buchstabe „C“ (für den CHARACTER-Typ) zugeordnet.

Wenn Sie eine manuelle IMPORT-Anweisung eingeben oder eine bestehende IMPORT-Anweisung bearbeiten, können Sie die spezifischeren Buchstabenwerte „E“ oder „U“ für EBCDIC- bzw. Unicode-Felder ersetzen.

Buchstabe

Analytics-Datentyp

A

ACL

B

BINARY

C

CHARACTER

D

DATETIME

E

EBCDIC

F

FLOAT

G

ACCPAC

K

IBMFLOAT

K

UNSIGNED

L

LOGICAL

N

PRINT

P

PACKED

Q

BASIC

R

MICRO

S

CUSTOM

T

PCASCII

U

UNICODE

V

VAXFLOAT

X

NUMERIC

Y

UNISYS

Z

ZONED