Commande IMPORT PDF
Crée une table Analytics en définissant et en important un fichier Adobe PDF.
Syntaxe
IMPORT PDF TO table <PASSWORD num> nom_fichier_importation FROM nom_fichier_source <SERVER nom_profil> ignorer_longueur <PARSER "VPDF"> <PAGES plage_page> {[syntaxe_enregistrement] [syntaxe_champ] <...n>} <...n>
syntaxe_enregistrement ::= RECORD nom_enregistrement type_enregistrement lignes_dans_enregistrement transparent [syntaxe_test] <...n>
syntaxe_test ::= TEST inclure_exclure type_correspondance AT ligne_départ,position_départ,plage logique texte
syntaxe_champ ::= FIELD nom type AT ligne_départ,position_départ SIZE longueur,lignes_dans_champ DEC valeur WID octets PIC format AS nom_affichage
Paramètres
Paramètres généraux
Nom | Description |
---|---|
TO table |
Nom de la table Analytics dans laquelle les données doivent être importées. Remarque La longueur des noms des tables est limitée à 64 caractères alphanumériques. Le nom peut inclure le caractère de soulignement ( _ ), mais aucun autre caractère spécial ni espace. Le nom ne peut pas commencer par un chiffre. |
PASSWORD num optionnel |
Fichiers PDF protégés par mot de passe. Définition de mot de passe à utiliser. Vous n'utilisez pas PASSWORD num pour inviter à saisir ou pour spécifier un mot de passe réel. La définition de mot de passe renvoie à un mot de passe fourni ou défini auparavant à l'aide de la commande PASSWORD, de la commande SET PASSWORD ou de la balise d'outil d'analyse PASSWORD. num correspond au numéro de la définition de mot de passe. Par exemple, si deux mots de passe ont été fournis ou définis auparavant dans un script, ou lors de la planification d'un outil d'analyse, PASSWORD 2 indique que le mot de passe n° 2 est utilisé. Pour plus d'informations sur la fourniture ou définition de mots de passe, consultez les rubriques : |
nom_fichier_importation |
Nom du fichier de données Analytics à créer. Indiquez nom_fichier_importation sous forme de chaîne entre guillemets avec une extension de fichier .FIL. Par exemple, "Factures.FIL". Par défaut, le fichier de données (.FIL) est enregistré dans le dossier contenant le projet Analytics. Utilisez un chemin de fichier absolu ou relatif pour enregistrer le fichier de données dans un autre dossier existant :
|
FROM nom_fichier_source |
Nom du fichier de données source. nom_fichier_source doit être une chaîne entre guillemets. Si le fichier de données source n'est pas enregistré dans le même répertoire que le projet Analytics, vous devez utiliser un chemin d'accès absolu ou un chemin d'accès relatif pour indiquer l'emplacement du fichier :
|
SERVER nom_profil optionnel |
Nom de profil du serveur contenant les données à importer. |
ignorer_longueur
optionnel |
Nombre d'octets à ignorer au début du fichier. Par exemple, si les 32 premiers octets contiennent des informations d'en-tête, spécifiez une valeur de 32 pour ignorer_longueur afin que ces informations soient omises. Remarque Pour les données Unicode, spécifiez uniquement un nombre d'octets pair. Indiquer un nombre impair d'octets peut entraîner des problèmes lors du traitement ultérieur des données importées. |
PARSER "VPDF" optionnel |
Utilisez l'analyseur VeryPDF pour analyser le fichier PDF pendant le processus de définition des fichiers. Si vous ignorez PARSER, l'analyseur Xpdf par défaut est utilisé. Si vous importez le PDF pour la première fois et que vous n'avez aucune raison de faire autrement, utilisez l'analyseur Xpdf par défaut. Si vous avez déjà rencontré des problèmes d'alignement des données lors de l'utilisation de Xpdf avec le fichier, utilisez l'analyseur VeryPDF pour voir si les résultats d'analyse sont meilleurs. |
PAGES plage_page optionnel |
Les pages à inclure si vous ne souhaitez pas importer toutes les pages du fichier PDF. plage_page doit être indiqué sous forme de chaîne entre guillemets. Vous pouvez indiquer :
Si vous omettez PAGES, toutes les pages du fichier PDF sont importées. |
Paramètre RECORD
Informations de définition générales des enregistrements.
Remarque
Certaines informations de définition d'enregistrement sont indiquées à l'aide de codes numériques mappant vers les options dans l'Assistant de définition de données.
Dans les scripts, indiquez le code numérique et non le nom de l'option.
Nom | Description |
---|---|
RECORD nom_enregistrement |
Nom de l'enregistrement dans l'Assistant de définition de données. Il est obligatoire d'indiquer nom_enregistrement dans la commande IMPORT PDF, mais la valeur nom_enregistrement n'apparaît pas dans la table Analytics créée. Dans l'Assistant de définition de données, Analytics fournit les noms par défaut basés sur le type d'enregistrement :
Vous pouvez utiliser les noms par défaut ou indiquez des noms différents. |
type_enregistrement |
Les trois types d'enregistrement possibles lors de la définition d'un fichier PDF :
Remarque Vous pouvez définir plusieurs jeux d'enregistrements d'en-tête et de pied de page dans une seule exécution d'IMPORT PDF, mais vous pouvez définir uniquement un seul jeu d'enregistrements de détail. |
lignes_dans_enregistrement |
Nombre de lignes occupées par un enregistrement dans le fichier PDF. Vous pouvez définir des enregistrements sur une seule ligne ou sur plusieurs lignes à associer aux données dans le fichier PDF. |
transparent |
Paramètre de transparence pour un enregistrement d'en-tête. Remarque S'applique aux enregistrements d'en-tête uniquement.
Les enregistrements d'en-tête transparents ne ventilent pas les enregistrements de détail multilignes. Si un enregistrement d'en-tête ventile un enregistrement de détail multiligne dans le fichier source PDF, ce qui peut se produire à l'endroit d'un saut de page, indiquer 1 (transparent) unifie l'enregistrement de détail dans la table Analytics créée. |
Paramètre TEST
Critères de définition d'un jeu d'enregistrements dans le fichier PDF. Vous pouvez avoir une ou plusieurs occurrences de TEST (8 max.) pour chaque occurrence de RECORD.
Remarque
Certains critères sont indiqués à l'aide des codes numériques mappant vers les options dans l'Assistant de définition de données (les noms des options sont indiqués entre parenthèses ci-dessous).
Dans les scripts, indiquez le code numérique et non le nom de l'option.
Nom | Description | ||||
---|---|---|---|---|---|
TEST inclure_exclure |
Comment traiter la correspondance des données :
|
||||
type_correspondance |
Type de correspondance à effectuer :
|
||||
AT ligne_départ; position_départ; plage |
|
||||
logique |
Relations logiques entre les critères :
|
||||
texte |
Caractères littéraux ou génériques par rapport auxquels les associer :
Pour les autres correspondances, texte est une chaîne de caractères vide "". |
Paramètres FIELD
Informations de définition de champ.
Nom | Description | ||||
---|---|---|---|---|---|
FIELD nom type |
Les champs individuels à importer à partir du fichier de données source, y compris le nom et le type de données du champ. Pour empêcher l'importation d'un champ, ne l'indiquez pas. Pour plus d'informations sur le type, consultez la rubrique Identificateurs des types de données de champ. |
||||
AT ligne_départ; position_départ |
|
||||
SIZE longueur, lignes_dans_champ |
|
||||
DEC valeur |
Nombre de décimales contenues par les champs numériques |
||||
WID octets |
Largeur d'affichage du champ en nombre d'octets. La valeur indiquée contrôle la largeur d'affichage du champ dans les vues et rapports Analytics. La largeur d'affichage n'altère jamais les données ; elle peut toutefois masquer des données si elle est plus courte que la longueur du champ. |
||||
PIC format |
Remarque S'applique aux champs numériques ou DateHeure.
Le format doit être placé entre guillemets. |
||||
AS nom_affichage |
Le nom d'affichage (titre de la colonne) pour le champ dans la vue dans la nouvelle table Analytics. Indiquez le nom_affichage sous forme de chaîne entre guillemets. Utilisez un point-virgule (;) entre les mots si vous souhaitez insérer un saut de ligne dans le titre de la colonne. AS est requis lors de la définition de FIELD. Pour que le nom d'affichage soit identique au champ nom, saisissez une valeur nom_affichage vide à l'aide de la syntaxe suivante : AS "". Vérifiez qu'il n'y a aucune espace entre les deux guillemets doubles. |
Exemples
Importer des données à partir d'une page spécifique d'un fichier PDF
Vous importez des données à partir de la page 1 d'un fichier PDF protégé par mot de passe, Fournisseurs.pdf :
Un jeu d'enregistrements de détail, avec trois champs, est créé dans la table Analytics créée, Liste_Fournisseurs :
IMPORT PDF TO Liste_Fournisseurs PASSWORD 1 "Liste_Fournisseurs.FIL" FROM "Liste_Fournisseurs.pdf" 2 PAGES "1" RECORD "Détail" 0 1 0 TEST 0 3 AT 1,1,0 7 "" FIELD "Numéro_fournisseur" C AT 1,1 SIZE 10,1 DEC 0 WID 10 PIC "" AS "" FIELD "Nom_Fournisseur" C AT 1,33 SIZE 58,1 DEC 0 WID 58 PIC "" AS "" FIELD "Dernière_Date_active" D AT 1,277 SIZE 20,1 DEC 0 WID 20 PIC "JJ/MM/AAAA" AS ""
Remarques
Remarque
Pour plus d'informations sur le fonctionnement de cette commande, consultez le Aide d'Analytics.
Dépannage pour les importations PDF dans l'édition Unicode d'Analytics
Si vous rencontrez des difficultés lorsque vous importez un fichier PDF à l'aide de l'édition Unicode d'Analytics, il se peut que le problème soit associé aux spécifications des longueurs :
-
Si des caractères de langues étrangères apparaissent anormalement ou si le format de la table Analytics créée est asymétrique, vérifiez que la longueur de SIZE est bien définie sur un nombre pair.
Indiquer un nombre impair d'octets pour la longueur de SIZE peut entraîner des problèmes lors du traitement ultérieur des données importées.
- Si la table Analytics est créée, mais qu'elle ne contient aucun enregistrement, essayez de définir ignorer_longueur sur 2 ou sur un autre nombre pair si des données d'en-tête se trouvent au début du fichier que vous souhaitez ignorer.
Identificateurs des types de données de champ
Le tableau ci-dessous répertorie les lettres que vous devez utiliser lorsque vous indiquez type pour FIELD. Chaque lettre correspond à un type de données Analytics.
Par exemple, si vous définissez un champ Nom, qui requiert un type de données caractère, vous devez indiquer « C » : FIELD "Nom" C.
Pour obtenir plus d'informations, consultez la section Types de données Analytics.
Remarque
Lorsque vous utilisez l'Assistant de définition de données pour définir une table qui comprend des champs EBCDIC, Unicode ou ASCII, ces derniers se voient automatiquement attribuer la lettre « C » (pour le type CHARACTER).
Lorsque vous saisissez manuellement une instruction IMPORT ou que vous modifiez une instruction IMPORT existante, vous pouvez remplacer les lettres « E » ou « U » par des champs EBCDIC ou Unicode.
Lettre |
Type de données Analytics |
---|---|
A |
ACL |
B |
BINARY |
C |
CHARACTER |
D |
DATETIME |
E |
EBCDIC |
F |
FLOAT |
G |
ACCPAC |
I |
IBMFLOAT |
K |
UNSIGNED |
L |
LOGICAL |
N |
|
P |
PACKED |
Q |
BASIC |
R |
MICRO |
S |
CUSTOM |
T |
PCASCII |
U |
UNICODE |
V |
VAXFLOAT |
X |
NUMERIC |
Y |
UNISYS |
Z |
ZONED |