Définition et importation d'un fichier PDF
Information de concept
Vous pouvez créer une table Analytics en définissant et en important un fichier Adobe PDF.
Lorsque vous utilisez l'Assistant de définition de données pour traiter un fichier PDF, Analytics peut entièrement ou partiellement définir automatiquement le fichier ou il se peut que vous deviez définir le fichier manuellement.
Remarque
La définition des fichiers PDF peut s'avérer compliquée. Si vous rencontrez des problèmes, consultez la section Définition et importation des fichiers image d'importation (rapport) et des fichiers PDF.
Localiser et sélectionner le fichier PDF
- Sélectionnez Fichier > Nouveau > Table.
- Si la page Sélectionner la plateforme comme source de données s'affiche, sélectionnez Local et cliquez sur Suivant.
- Dans la page Sélectionner la source de données locale, sélectionnez Fichier, puis cliquez sur Suivant.
- Dans la boîte de dialogue Sélectionner le fichier à définir, localisez et sélectionnez le fichier PDF à partir duquel vous souhaitez créer la table Analytics, puis cliquez sur Ouvrir.
Les fichiers Adobe PDF présentent une extension .pdf.
- Dans la page Format de fichier, vérifiez queFichier PDF Adobe Acrobat est sélectionné, puis cliquez sur Suivant.
Définir le fichier PDF
- Dans la page Définition du fichier PDF, si besoin, saisissez le mot de passe correspondant au fichier PDF, puis cliquez sur Suivant.
- Si vous souhaitez spécifier une page ou plage de pages particulière pour l'analyse, plutôt que Toutes les pages, en sélectionnant Pages, et spécifiez un ou plusieurs numéros de pages.
Vous pouvez spécifier des pages individuelles séparées par des virgules (1,3,5), des plages de pages (2-7) ou une combinaison des deux (1, 3, 5-7, 11).
Astuce
Dans certains cas, l'analyse d'un fichier PDF page par page peut aider à résoudre un problème de mauvais alignement des données.
Si vous choisissez cette approche, vous devrez importer plusieurs fois le fichier, créer plusieurs tables Analytics, puis annexer les tables créées dans Analytics.
Pour plus d'informations, consultez la rubrique Définition et importation de sous-jeux de données image d'impression ou PDF.
- Laissez l'analyseur PDF sur le paramètre par défaut Xpdf ou sélectionnez VeryPDF.
Si vous importez le fichier pour la première fois et que vous n'avez aucune raison de faire autrement, laissez le paramètre sur Xpdf.
Si vous avez déjà rencontré des problèmes d'alignement des données lors de l'utilisation de Xpdf avec le fichier, sélectionnez VeryPDF pour voir si les résultats d'analyse sont meilleurs.
- Cliquez sur Suivant.
Le fichier PDF est analysé et la page Définition du fichier PDF s'actualise pour afficher le fichier analysé.
- Faites défiler la page à la verticale et à l'horizontale pour examiner le fichier examiné.
Le surlignage indique si Analytics a défini automatiquement les données dans le fichier :
Surlignement Signification Surlignement bleu aqua Données auto-définies comme champ. Surlignement gris Données auto-définies comme enregistrement.
La définition de l'enregistrement dépend d'au moins un champ dans l'enregistrement.
Arrière-plan blanc Données non définies.
Analytics n'a pas pu détecter de motif récurrent dans les données et n'a pas pu les définir automatiquement.
- Facultatif. Si les données du fichier analysé sont mal alignées, cliquez sur Précédent, faites basculer la sélection de l'analyseur dans Analyseur PDF, puis cliquez sur Suivant.
Le fichier PDF est réanalysé à l'aide de l'analyseur sélectionné, ce qui peut produire un meilleur alignement des données.
Toutes les définitions de champs et d'enregistrements existantes sont supprimées lorsque vous réanalysez le fichier.
- Effectuez l'une des options suivantes :
Résultat de l'auto-définition Action à entreprendre Si Analytics a automatiquement défini le fichier et que vous ne souhaitez pas faire de mises à jour Si Analytics a automatiquement et parfaitement défini l'ensemble du fichier, et que vous ne voulez pas : - mettre à jour les noms des champs génériques
- ajouter des données d'en-tête ou de pied de page aux données de détails
Si Analytics a automatiquement défini le fichier et que vous souhaitez effectuer des mises à jour Si Analytics a automatiquement et parfaitement défini l'ensemble du fichier, et que vous voulez :- mettre à jour les noms de champ générique (“Field_1”, “Field_2”, et), aller à Modifier la définition automatique
- Si vous souhaitez ajouter un en-tête ou un pied de données aux détails des données, allez dans Définir manuellement le fichier PDF
Astuce
Vous pouvez aussi mettre à jour les noms des champs génériques dans une page ultérieure dans l'Assistant de définition de données, ce que vous trouverez peut-être plus pratique.
Si la définition automatique contient des erreurs Si la définition automatique : - contient des erreurs
- exclut les données dont vous avez besoin
- inclut des données dont vous n'avez pas besoin
vous devez effectuer l'une des actions suivantes :
- Modifier la définition automatique
- supprimer l'ensemble des définitions automatiques et Définir manuellement le fichier PDF
Astuce
Si la définition automatique contient des erreurs significatives, il peut s'avérer plus simple de supprimer l'intégralité de la définition automatique et de définir manuellement le fichier.
Si le fichier analysé est entièrement indéfini Si le fichier analysé est entièrement indéfini, indiqué par un arrière-plan complètement blanc, vous devez Définir manuellement le fichier PDF
Modifier la définition automatique
Si vous souhaitez modifier la définition automatique (ou une définition manuelle), dans la page Définition du fichier PDF, effectuez l'une des actions suivantes :
| Modifier une tâche | Instructions |
|---|---|
| Modifier une définition de champ | Cliquez avec le bouton droit de la souris sur un champ bleu aqua et sélectionnez Modifier le champ ou double-cliquez sur le champ. Vous pouvez effectuer un certain nombre de modifications, notamment :
Pour des informations détaillées, consultez la rubrique Utilisation de définitions de champs. |
| Modifier une définition d'enregistrement | Cliquez avec le bouton droit de la souris sur un enregistrement gris et sélectionnez Modifier l'enregistrement ou double-cliquez sur l'enregistrement. Vous pouvez effectuer deux modifications principales :
Pour des informations détaillées, consultez la rubrique Utilisation de définitions d'enregistrements. |
| Supprimer une définition de champ ou une définition d'enregistrement | Cliquez avec le bouton droit de la souris sur un champ ou sur un enregistrement et sélectionnez Supprimer le champ ou Supprimer l'enregistrement. Vous pouvez supprimer les définitions pour des champs que vous ne souhaitez pas dans la table Analytics ou que vous souhaitez définir manuellement en raison d'erreurs dans la définition automatique. Si vous supprimez une définition d'enregistrement, les définitions de champs contenues dans l'enregistrement sont également supprimées et toutes les instances de la définition d'enregistrement dans le fichier sont supprimées. Remarque Vous supprimez la définition de champ ou la définition d'enregistrement uniquement, pas les données réelles. Si nécessaire, vous pouvez redéfinir les mêmes données de champ ou d'enregistrement. Astuce Si vous souhaitez supprimer des enregistrements de façon sélective, sélectionnez Modifier l'enregistrement et affinez les critères utilisés par Analytics pour capturer le jeu d'enregistrements. Pour des informations détaillées, consultez la section Utilisation de définitions d'enregistrements. |
Définir manuellement le fichier PDF
Astuce
Avant de commencer, il peut s'avérer utile de commencer par revoir la version de base de la procédure ci-dessous, avec les captures d'écran correspondantes : Procédure de démarrage rapide.
Remarque
Vous pouvez aussi définir un fichier PDF à l'aide des définitions de champs et d'enregistrements enregistrées, le cas échéant.
Pour plus d'informations, consultez la section Définir le fichier PDF à l'aide d'un ensemble de définitions de champs et d'enregistrements enregistrées.
- Dans la page Définition du fichier PDF, sélectionnez une valeur de données pour commencer à définir l'un des champs dans la table.
Par exemple, vous pourriez sélectionner un numéro de sécurité sociale dans un champ SSN. Lorsque vous sélectionnez la valeur de données, la boîte de dialogue Définition de champ s'ouvre.
Instructions :
- Vous pouvez sélectionner une valeur n'importe où dans les données. Vous n'êtes pas tenu d'utiliser le premier champ dans la table ni de sélectionner la première valeur d'un champ.
- La valeur que vous sélectionnez peut être des données de détail, d'en-tête ou de pied de page.
- Ne sélectionnez pas de noms de champs. Laissez les noms de champ désélectionnés dans le fichier source. Si vous sélectionnez des noms de champs dans le fichier source, Analytics les traite sous forme de données contenues dans les champs.
- Si la longueur des valeurs des champs varie, sélectionnez la valeur la plus longue ou bien sélectionnez des espaces vides supplémentaires pour autoriser des valeurs plus longues qui peuvent être plus faibles dans le champ et qui ne sont pas affichées actuellement.
Si vous avez l'intention d'utiliser la valeur de données initiale pour identifier un jeu d'enregistrements de manière unique, consultez la section Utilisation de définitions de champs.
- Saisissez un nom pour le champ, actualisez si nécessaire le type de données, puis cliquez sur OK.
- Dans la valeur de données que vous venez de sélectionner, ou dans la même ligne dans le fichier, sélectionnez le caractère ou la chaîne de caractères qui identifie de manière unique le jeu d'enregistrements dans le fichier source.
Par exemple, sélectionnez :
- une barre oblique dans une valeur de type date
- une virgule décimale dans une valeur de type numérique
- une valeur d'identification unique n'importe où dans la ligne contenant la valeur de données que vous avez sélectionnée
Lorsque vous sélectionnez le ou les caractères uniques, la boîte de dialogue Définition d'enregistrement s'ouvre et tous les enregistrements contenant le ou les caractères sont mis en surbrillance en gris.
Pour des informations détaillées, consultez la section Définition et importation des fichiers image d'importation (rapport) et des fichiers PDF.
Si vous devez définir un enregistrement qui s'étend au-delà d'une ligne dans le fichier source, consultez la section Utilisation d'enregistrements et de champs multilignes.
- Si besoin, actualisez le Type d'enregistrement pour associer le type de données que vous définissez : détail, en-tête ou pied de page.
- Si nécessaire, modifiez les critères utilisés pour capturer le jeu d'enregistrements.
Par exemple, vous pourriez ajouter d'autres critères pour omettre certains enregistrements ayant été capturés à l'origine.
Pour des informations détaillées, consultez la section Utilisation de définitions d'enregistrements.
- Cliquez sur OK.
Le champ que vous avez défini est mis en surbrillance en bleu aqua et le jeu d'enregistrements capturés associé est mis en surbrillance en gris.
- Faites défiler la page verticalement pour examiner le champ défini et le jeu des enregistrements capturés associé.
- Si le champ n'est pas défini correctement ou si le jeu des enregistrements capturés a besoin d'un ajustement, double-cliquez sur le champ ou sur l'enregistrement et apportez les modifications nécessaires dans la boîte de dialogue Définition de champ ou Définition d'enregistrement.
Pour plus d’informations, consultez la rubrique Utilisation de définitions de champs ou Utilisation de définitions d'enregistrements.
- Définissez les champs restants dans l'enregistrement en sélectionnant une valeur de données représentative pour chaque champ.
Les autres champs s'adaptent automatiquement au jeu d'enregistrements.
Instructions :
- Définissez uniquement les champs de votre choix dans la table Analytics.
- Avec chaque définition de champ, faites défiler la page verticalement pour examiner le champ défini. Modifiez les définitions si besoin.
Par exemple, si les valeurs de données ne sont pas entièrement contenues par un champ, vous devez ajuster la longueur ou la position de départ du champ ou bien les deux.
Pour plus d'informations, consultez la rubrique Modifier la définition automatique.
- Si vous devez définir des valeurs de champ qui s'étendent au-delà d'une ligne dans le fichier source, consultez la section Utilisation d'enregistrements et de champs multilignes.
AstuceL'ordre dans lequel vous définissez les champs de détail est celui dans lequel ils apparaissent dans la table Analytics alors créée.
Si vous supprimez un champ de détail pendant le processus de définition et que vous le rajoutez, il perd sa position d'origine et il est placé en dernière position parmi les champs de détail.
- Si vous souhaitez définir un autre champ, répétez les étapes 1 à 9.
Instructions :
- Lorsque vous sélectionnez une valeur de données pour commencer à définir un nouveau champ et un nouveau jeu d'enregistrements associé, assurez-vous que Nouvel enregistrement est sélectionné dans la boîte de dialogue qui s'affiche, puis cliquez sur OK.
- Vous pouvez définir plusieurs enregistrements d'en-tête ou de pied de page, mais seulement un enregistrement de détail. L'ordre dans lequel vous définissez les différents types d'enregistrement n'est pas respecté.
Définir le fichier PDF à l'aide d'un ensemble de définitions de champs et d'enregistrements enregistrées
Vous pouvez définir un fichier PDF à l'aide des définitions de champs et d'enregistrements d'une session de définition de fichier précédente ayant été enregistrée dans un fichier de requête image d'impression. Le fichier de requête image d'impression doit déjà exister et les définitions enregistrées doivent correspondre aux données actuelles.
Remarque
Le chargement d'un fichier de requête image d'impression supprime les définitions de champs et d'enregistrements actuelles.
- Dans la page Définition du fichier PDF, cliquez sur Charger.
- Accédez à un fichier de requête image d'impression enregistré précédemment, sélectionnez-le, puis cliquez sur Ouvrir.
Les définitions s'appliquent aux données actuelles.
Les fichiers de requête image d'impression présentent généralement une extension .txt.
Remarque
Chargez uniquement un fichier avec des définitions qui correspondent exactement ou presque aux données actives.
- Après avoir chargé le fichier, effectuez l'une des opérations suivantes :
- Si l'ensemble du fichier est maintenant parfaitement défini aller à Finaliser la définition de fichier PDF
- Si la définition du fichier nécessite des ajustements aller à Modifier la définition automatique
Finaliser la définition de fichier PDF
- Facultatif. Si vous souhaitez enregistrer l'ensemble actuel de définitions de champs et d'enregistrements dans un fichier de requête image d'impression, procédez comme suit :
- Cliquez sur Enregistrer.
- Entrez un nom pour le fichier de requête image d'impression, puis cliquez sur Enregistrer.
Remarque
Les définitions de champs et d'enregistrements représentent souvent beaucoup de travail ; il est donc recommandé de les enregistrer.
Si vous découvrez par la suite que les données importées doivent être ajustées, puis redéfinies et réimportées, les définitions enregistrées ne doivent pas forcément être recréées depuis le début.
- Lorsque vous êtes satisfait de l'ensemble des définitions de champs et d'enregistrements, cliquez sur Suivant.
Remarque
Si besoin, vous pouvez revenir à cette étape du processus et apporter des mises à jour aux définitions de champs et d'enregistrements.
Enregistrer le fichier de données Analytics
Dans la boîte de dialogue Enregistrer le fichier de données sous, saisissez le nom du fichier de données Analytics, puis cliquez sur Enregistrer.Analytics
Si Analytics prérenseigne le nom de fichier de données, vous pouvez l'accepter ou le modifier.
Vous pouvez aussi accéder à un autre dossier pour enregistrer le fichier de données si vous ne voulez pas utiliser l'emplacement par défaut ouvert par Analytics.
Modifier les propriétés des champs Analytics
Dans la page Modifier les propriétés des champs, vérifiez les paramètres attribuées par Analytics aux propriétés répertoriées ci-après, effectuez toutes les mises à jour requises, puis cliquez sur Suivant.Analytics
Remarque
Sélectionnez un en-tête de colonne dans la table d'aperçu pour voir les propriétés associées à la colonne.
| Propriétés | Description |
|---|---|
| Ignorer ce champ | Exclue le champ dans le format de la table des résultats. Les données du champ sont toujours importées, mais ne sont pas définies et ne s'affichent pas dans la nouvelle table Analytics. Elles peuvent être définies ultérieurement, si nécessaire, et ajoutées à la table. |
| Nom | Le nom du champ dans le format de table. Vous pouvez conserver le nom de champ attribué par Analytics, ou saisir un autre nom. |
| Titre de colonne | Le titre de colonne du champ dans la vue Analytics par défaut. Si vous ne spécifiez pas de titre de colonne, la valeur Nom est utilisée. |
| Type | Le type de données attribué au champ dans Analytics. Vous pouvez conserver le type de données attribué par Analytics, ou sélectionner un type de données approprié dans la liste déroulante. Pour des informations détaillées sur les types de données pris en charge dans Analytics, consultez la section Types de données dans Analytics. |
| Valeur | Une propriété en lecture seule qui affiche la première valeur dans le champ. La valeur est mise à jour de manière dynamique en fonction des modifications que vous apportez. |
| Décimale | Champs numériques uniquement. Le nombre de décimale dans les données sources. Remarque La zone de texte Décimale s'affiche automatiquement lorsque vous sélectionnez un type de données Numérique. |
| Format d'entrée | Champs DateHeure uniquement. Le format des valeurs DateHeure dans les données sources. Le format que vous spécifiez doit correspondre exactement au format dans les données source. Pour plus d'informations sur les formats de date et d'heure, consultez la section Formats des données source date et heure. |
Finaliser l'import
- Dans la page Sélection finale, vérifiez les paramètres de la nouvelle table Analytics, puis cliquez sur Terminer.Analytics
Si vous souhaitez effectuer des changements, cliquez surPrécédent pour obtenir la bonne page dans l'assistant.
- Entrez un nom pour le format de table que vous ajoutez au projet, ou conservez le nom par défaut, et cliquez sur OK.
La nouvelle table Analytics est créée avec les données du fichier importé.
Remarque
La longueur des noms des tables Analytics est limitée à 64 caractères alphanumériques, sans l’extension .FIL. Le nom peut inclure le caractère de soulignement ( _ ), mais aucun autre caractère spécial ni espace. Le nom ne peut pas commencer par un chiffre.