Commande IMPORT PDF

Crée une table Analytics en définissant et en important un fichier Adobe PDF.

Syntaxe

IMPORT PDF TO table <PASSWORD num> nom_fichier_importation FROM nom_fichier_source <SERVER nom_profil> ignorer_longueur <PARSER "VPDF"> <PAGES plage_page> {[syntaxe_enregistrement] [syntaxe_champ] <...n>} <...n>
syntaxe_enregistrement ::=
RECORD nom_enregistrement type_enregistrement lignes_dans_enregistrement transparent [syntaxe_test] <...n>
syntaxe_test ::=
TEST inclure_exclure type_correspondance AT ligne_départ,position_départ,plage logique texte
syntaxe_champ ::=
FIELD nom type AT ligne_départ,position_départ SIZE longueur,lignes_dans_champ DEC valeur WID octets PIC format AS nom_affichage

Paramètres

Paramètres généraux

Nom Description
TO table

Nom de la table Analytics dans laquelle les données doivent être importées.

Remarque

La longueur des noms des tables est limitée à 64 caractères alphanumériques. Le nom peut inclure le caractère de soulignement ( _ ), mais aucun autre caractère spécial ni espace. Le nom ne peut pas commencer par un chiffre.

PASSWORD num

optionnel

Fichiers PDF protégés par mot de passe.

Définition de mot de passe à utiliser.

Vous n'utilisez pas PASSWORD num pour inviter à saisir ou pour spécifier un mot de passe réel. La définition de mot de passe renvoie à un mot de passe fourni ou défini auparavant à l'aide de la commande PASSWORD, de la commande SET PASSWORD ou de la balise d'outil d'analyse PASSWORD.

num correspond au numéro de la définition de mot de passe. Par exemple, si deux mots de passe ont été fournis ou définis auparavant dans un script, ou lors de la planification d'un script d'analyse de données, PASSWORD 2 indique que le mot de passe n° 2 est utilisé.

Pour plus d'informations sur la fourniture ou définition de mots de passe, consultez les rubriques :

nom_fichier_importation

Nom du fichier de données Analytics à créer.

Indiquez nom_fichier_importation sous forme de chaîne entre guillemets avec une extension de fichier .FIL. Par exemple, "Factures.FIL".

Par défaut, le fichier de données (.FIL) est enregistré dans le dossier contenant le projet Analytics.

Utilisez un chemin de fichier absolu ou relatif pour enregistrer le fichier de données dans un autre dossier existant :

  • "C:\données\Factures.FIL"
  • "données\Factures.FIL"

FROM nom_fichier_source

Nom du fichier de données source. nom_fichier_source doit être une chaîne entre guillemets.

Si le fichier de données source n'est pas enregistré dans le même répertoire que le projet Analytics, vous devez utiliser un chemin d'accès absolu ou un chemin d'accès relatif pour indiquer l'emplacement du fichier :

  • "C:\données\nom_fichier_source"
  • "donnéesnom_fichier_source"
SERVER nom_profil

optionnel

Nom de profil du serveur contenant les données à importer.
ignorer_longueur

optionnel

Nombre d'octets à ignorer au début du fichier.

Par exemple, si les 32 premiers octets contiennent des informations d'en-tête, spécifiez une valeur de 32 pour ignorer_longueur afin que ces informations soient omises.

Remarque

Pour les données Unicode, spécifiez uniquement un nombre d'octets pair. Indiquer un nombre impair d'octets peut entraîner des problèmes lors du traitement ultérieur des données importées.

PARSER "VPDF"

optionnel

Utilisez l'analyseur VeryPDF pour analyser le fichier PDF pendant le processus de définition des fichiers.

Si vous ignorez PARSER, l'analyseur Xpdf par défaut est utilisé.

Si vous importez le PDF pour la première fois et que vous n'avez aucune raison de faire autrement, utilisez l'analyseur Xpdf par défaut. Si vous avez déjà rencontré des problèmes d'alignement des données lors de l'utilisation de Xpdf avec le fichier, utilisez l'analyseur VeryPDF pour voir si les résultats d'analyse sont meilleurs.

PAGES plage_page

optionnel

Les pages à inclure si vous ne souhaitez pas importer toutes les pages du fichier PDF. plage_page doit être indiqué sous forme de chaîne entre guillemets.

Vous pouvez indiquer :

  • pages individuelles séparées par des virgules (1,3,5)
  • étendues de pages (2-7)
  • une combinaison de pages et de plages (1, 3, 5-7, 11)

Si vous omettez PAGES, toutes les pages du fichier PDF sont importées.

Paramètre RECORD

Informations de définition générales des enregistrements.

Remarque

Certaines informations de définition d'enregistrement sont indiquées à l'aide de codes numériques mappant vers les options dans l'Assistant de définition de données.

Dans les scripts, indiquez le code numérique et non le nom de l'option.

Nom Description

RECORD nom_enregistrement

Nom de l'enregistrement dans l'Assistant de définition de données.

Il est obligatoire d'indiquer nom_enregistrement dans la commande IMPORT PDF, mais la valeur nom_enregistrement n'apparaît pas dans la table Analytics créée.Analytics

Dans l'Assistant de définition de données, Analytics fournit les noms par défaut basés sur le type d'enregistrement :

  • Détail
  • En-têten
  • Pied de pagen

Vous pouvez utiliser les noms par défaut ou indiquez des noms différents.

type_enregistrement

Les trois types d'enregistrement possibles lors de la définition d'un fichier PDF :

  • 0 : détail
  • 1 : en-tête
  • 2 : pied de page

Remarque

Vous pouvez définir plusieurs jeux d'enregistrements d'en-tête et de pied de page dans une seule exécution d'IMPORT PDF, mais vous pouvez définir uniquement un seul jeu d'enregistrements de détail.

lignes_dans_enregistrement

Nombre de lignes occupées par un enregistrement dans le fichier PDF.

Vous pouvez définir des enregistrements sur une seule ligne ou sur plusieurs lignes à associer aux données dans le fichier PDF.

transparent

Paramètre de transparence pour un enregistrement d'en-tête.

Remarque

S'applique aux enregistrements d'en-tête uniquement.

  • 0 : pas transparent
  • 1 : transparent

Les enregistrements d'en-tête transparents ne ventilent pas les enregistrements de détail multilignes.

Si un enregistrement d'en-tête ventile un enregistrement de détail multiligne dans le fichier source PDF, ce qui peut se produire à l'endroit d'un saut de page, indiquer 1 (transparent) unifie l'enregistrement de détail dans la table Analytics créée.Analytics

Paramètre TEST

Critères de définition d'un jeu d'enregistrements dans le fichier PDF. Vous pouvez avoir une ou plusieurs occurrences de TEST (8 max.) pour chaque occurrence de RECORD.

Remarque

Certains critères sont indiqués à l'aide des codes numériques mappant vers les options dans l'Assistant de définition de données (les noms des options sont indiqués entre parenthèses ci-dessous).

Dans les scripts, indiquez le code numérique et non le nom de l'option.

Nom Description
TEST inclure_exclure

Comment traiter la correspondance des données :

  • 0 : (Inclure) les données remplissant les critères sont incluses dans le jeu d'enregistrements
  • 1 : (Exclure) les données remplissant les critères sont exclues du jeu d'enregistrements
type_correspondance

Type de correspondance à effectuer :

  • 0 : (Corresp. exacte) : les enregistrements correspondants doivent contenir le caractère ou la chaîne de caractères à la ligne de départ spécifiée, à partir de la position spécifiée
  • 2 : (Alpha) les enregistrements correspondants doivent contenir un ou plusieurs caractères alphabétiques à la ligne de départ spécifiée, à la position de départ spécifiée ou à toutes les positions de la plage spécifiée
  • 3 : (Numérique) les enregistrements correspondants doivent contenir un ou plusieurs caractères numériques à la Ligne spécifiée, à la position de départ spécifiée ou à toutes les positions de la plage spécifiée
  • 4 : (Vide) les enregistrements correspondants doivent contenir un ou plusieurs espaces vides à la ligne de départ spécifiée, à la position de départ spécifiée ou à toutes les positions de la plage spécifiée
  • 5 : (Non vide) les enregistrements correspondants doivent contenir un ou plusieurs caractères non vides (y compris les caractères spéciaux) à la ligne de départ spécifiée, à la position de départ spécifiée ou à toutes les positions de la plage spécifiée
  • 7 : (Rechercher dans la ligne) les enregistrements correspondants doivent contenir le caractère ou la chaîne de caractères n'importe où sur la Ligne de départ spécifiée
  • 8 : (Rechercher dans la plage) les enregistrements correspondants doivent contenir le caractère ou la chaîne de caractères spécifié, à la ligne de départ spécifiée, n'importe où dans la plage spécifiée
  • 10 : (Modèle de texte) les enregistrements correspondants doivent contenir les caractères correspondant au schéma de caractères spécifié, à la ligne de départ spécifiée, à partir de la position spécifiée
AT ligne_départ; position_départ; plage
  • ligne_départ ligne d'un enregistrement auquel les critères s'appliquent

    Par exemple, si vous créez un modèle de texte qui fait correspondre les codes postaux et que ceux-ci apparaissent à la troisième ligne d'un enregistrement d'adresse de trois lignes, vous devez spécifier 3 dans ligne_départ.

    Remarque

    Pour les enregistrements d'une seule ligne, la valeur ligne_départ est toujours 1.

  • position_départ position d'octet de départ dans le fichier PDF pour la comparaison vis-à-vis des critères
  • plage nombre d'octets à partir de la position d'octet de départ dans le fichier PDF à utiliser dans la comparaison vis-à-vis des critères

    Si vous utilisez une position d'octet de départ uniquement, sans plage, indiquez 0 pour plage.

    Remarque

    Analytics non Unicode1 octet = 1 caractère
    Analytics Unicode2 octets = 1 caractère
logique

Relations logiques entre les critères :

  • 0 : (Et) le critère actuel et le critère suivant sont associés avec un AND logique
  • 1 : (Ou) le critère actuel et le critère suivant sont associés avec un OR logique
  • 4 : (Nouveau groupe > Et) le critère actuel est le dernier d'un groupe de critères logiques et le groupe actuel et le groupe suivant sont liés avec un AND logique
  • 5 : (Nouveau groupe > Ou) le critère actuel est le dernier d'un groupe de critères logiques et le groupe actuel et le groupe suivant sont liés avec un OR logique
  • 7 : (Fin) le critère actuel est le dernier d'un groupe de critères logiques
texte

Caractères littéraux ou génériques par rapport auxquels les associer :

  • Pour Corresp. exacte, Rechercher dans la ligne ou Rechercher dans la plage indique le caractère ou la chaîne de caractères qui identifie de manière unique le jeu d'enregistrements dans le fichier PDF.
  • Pour Modèle de texte indique le schéma de caractères qui identifie de manière unique le jeu d'enregistrements dans le fichier PDF

    L'option Modèle de texte utilise la même syntaxe que la Fonction MAP( ).

Pour les autres correspondances, texte est une chaîne de caractères vide "".

Paramètres FIELD

Informations de définition de champ.

Nom Description
FIELD nom type

Les champs individuels à importer à partir du fichier de données source, y compris le nom et le type de données du champ. Pour empêcher l'importation d'un champ, ne l'indiquez pas.

Pour plus d'informations sur le type, consultez la rubrique Identificateurs des types de données de champ.

AT ligne_départ; position_départ
  • ligne_départ ligne de départ du champ dans l'enregistrement dans le fichier PDF

    Pour les enregistrements multilignes dans un fichier PDF, ligne_départ vous permet de commencer un champ à n'importe quelle ligne de l'enregistrement. ligne_départ est toujours 1 si lignes_dans_enregistrement est 1.

  • position_départ position d'octet de départ du champ dans le fichier PDF

    Remarque

    Analytics non Unicode1 octet = 1 caractère
    Analytics Unicode2 octets = 1 caractère

    Dans Analytics Unicode, normalement vous devez indiquer une position d'octet de départ avec un nombre impair. Indiquer une position de départ avec un chiffre pair peut entraîner l'affichage incorrect des caractères.

SIZE longueur, lignes_dans_champ
  • longueur longueur du champ en octets dans le format de la table AnalyticsAnalytics

    Remarque

    Analytics non Unicode 1 octet = 1 caractère
    Analytics Unicode 2 octets = 1 caractère

    Dans Analytics Unicode, spécifiez uniquement un nombre d'octets pair. Indiquer un nombre d'octets impair peut entraîner l'affichage incorrect des caractères.

  • lignes_dans_champ nombre de lignes occupées par une seule valeur de champ dans le fichier PDF

    Vous pouvez définir des champs unilignes ou multilignes pour associer les données du fichier.

    Remarque

    Le nombre de lignes spécifié pour un champ ne peut pas dépasser le nombre de lignes spécifié pour l'enregistrement contenant le champ.

DEC valeur

Nombre de décimales contenues par les champs numériques

WID octets

Largeur d'affichage du champ en nombre d'octets.

La valeur indiquée contrôle la largeur d'affichage du champ dans les vues et rapports Analytics. La largeur d'affichage n'altère jamais les données ; elle peut toutefois masquer des données si elle est plus courte que la longueur du champ.

PIC format

Remarque

S'applique aux champs numériques ou DateHeure.

  • champs numériques format d'affichage des valeurs numériques dans les vues et rapports AnalyticsAnalytics
  • champs DateHeure format physique des valeurs DateHeure dans les données source (ordre des caractères date et heure, séparateurs, etc.)

    Remarque

    Pour les champs DateHeure, le format doit correspondre exactement au format physique dans les données source. Par exemple, si les données source sont 12/31/2014, vous devez saisir la date au format "MM/JJ/AAAA".

Le format doit être placé entre guillemets.

AS nom_affichage

Le nom d'affichage (titre de la colonne) pour le champ dans la vue dans la nouvelle table Analytics.

Indiquez le nom_affichage sous forme de chaîne entre guillemets. Utilisez un point-virgule (;) entre les mots si vous souhaitez insérer un saut de ligne dans le titre de la colonne.

AS est requis lors de la définition de FIELD. Pour que le nom d'affichage soit identique au champ nom, saisissez une valeur nom_affichage vide à l'aide de la syntaxe suivante : AS "". Vérifiez qu'il n'y a aucune espace entre les deux guillemets doubles.

Exemples

Importer des données à partir d'une page spécifique d'un fichier PDF

Vous importez des données à partir de la page 1 d'un fichier PDF protégé par mot de passe, Fournisseurs.pdf :

Un jeu d'enregistrements de détail, avec trois champs, est créé dans la table Analytics créée, Liste_Fournisseurs :Analytics

IMPORT PDF TO Liste_Fournisseurs PASSWORD 1 "Liste_Fournisseurs.FIL" FROM "Liste_Fournisseurs.pdf" 2 PAGES "1" RECORD "Détail" 0 1 0 TEST 0 3 AT 1,1,0 7 "" FIELD "Numéro_fournisseur" C AT 1,1 SIZE 10,1 DEC 0 WID 10  PIC "" AS "" FIELD "Nom_Fournisseur" C AT 1,33 SIZE 58,1 DEC 0 WID 58  PIC "" AS "" FIELD "Dernière_Date_active" D AT 1,277 SIZE 20,1 DEC 0 WID 20  PIC "JJ/MM/AAAA" AS ""

Remarques

Pour plus d'informations sur le fonctionnement de cette commande, consultez Définition et importation des fichiers image d'importation (rapport) et des fichiers PDF.

Dépannage pour les importations PDF dans l'édition Unicode d'Analytics

Si vous rencontrez des difficultés lorsque vous importez un fichier PDF à l'aide de l'édition Unicode d'Analytics, il se peut que le problème soit associé aux spécifications des longueurs :

  • Si des caractères de langues étrangères apparaissent anormalement ou si le format de la table Analytics créée est asymétrique, vérifiez que la longueur de SIZE est bien définie sur un nombre pair.Analytics

    Indiquer un nombre impair d'octets pour la longueur de SIZE peut entraîner des problèmes lors du traitement ultérieur des données importées.

  • Si la table Analytics est créée, mais qu'elle ne contient aucun enregistrement, essayez de définir ignorer_longueur sur 2 ou sur un autre nombre pair si des données d'en-tête se trouvent au début du fichier que vous souhaitez ignorer.Analytics

Identificateurs des types de données de champ

Le tableau ci-dessous répertorie les lettres que vous devez utiliser lorsque vous indiquez type pour FIELD. Chaque lettre correspond à un type de données Analytics.

Par exemple, si vous définissez un champ Nom, qui requiert un type de données caractère, vous devez indiquer « C » : FIELD "Nom" C.

Pour plus d'informations, consultez la section Types de données dans Analytics.

Remarque

Lorsque vous utilisez l'Assistant de définition de données pour définir une table qui comprend des champs EBCDIC, Unicode ou ASCII, ces derniers se voient automatiquement attribuer la lettre « C » (pour le type CHARACTER).

Lorsque vous saisissez manuellement une instruction IMPORT ou que vous modifiez une instruction IMPORT existante, vous pouvez remplacer les lettres « E » ou « U » par des champs EBCDIC ou Unicode.

Lettre

Type de données Analytics

A

ACL

B

BINARY

C

CHARACTER

D

DATETIME

E

EBCDIC

F

FLOAT

G

ACCPAC

I

IBMFLOAT

K

UNSIGNED

L

LOGICAL

N

PRINT

P

PACKED

Q

BASIC

R

MICRO

S

CUSTOM

T

PCASCII

U

UNICODE

V

VAXFLOAT

X

NUMERIC

Y

UNISYS

Z

ZONED