Commande IMPORT MULTIDELIMITED

Crée plusieurs tables Analytics en définissant et en important plusieurs fichiers délimités.

Syntaxe

IMPORT MULTIDELIMITED <TO dossier_import> FROM {nom_fichier_source|dossier_source} encodage_car_source SEPARATOR {car|TAB|SPACE} QUALIFIER {car|NONE} CONSECUTIVE STARTLINE numéro_ligne <KEEPTITLE> <CRCLEAR> <LFCLEAR> <REPLACENULL> <ALLCHAR>

Remarque

Vous devez indiquer les paramètres IMPORT MULTIDELIMITED exactement dans le même ordre que ci-dessus et dans le tableau ci-dessous.

Pour importer proprement plusieurs fichiers délimités, la structure de tous les fichiers doit être cohérente avant l'importation.

Pour plus d'informations, consultez la section Structure de fichiers cohérente requise.

Paramètres

Nom Description
TO dossier_import

optionnel

Dossier dans lequel importer les données.

Pour indiquer le dossier, utilisez un chemin d'accès au fichier absolu ou un chemin d'accès au fichier relatif au dossier contenant le projet Analytics. Indiquez dossier_import sous forme de chaîne entre guillemets.

Exemple

TO "C:\Point of Sale Audit\Données\Données de travail transaction"
TO "Données\Données de travail transaction"

Si vous omettez TO, les données sont importées dans le dossier contenant le projet Analytics.

FROM nom_fichier_source | dossier_source

Nom des fichiers de données source ou du dossier contenant les fichiers de données source.

Indiquez nom_fichier_source ou dossier_source sous forme de chaîne entre guillemets.

La commande prend en charge l'importation de quatre types de fichiers délimités :

  • *.csv
  • *.dat
  • *.del
  • *.txt

Fichiers de données source dans le dossier de projet Analytics racine

Pour indiquer plusieurs fichiers, utilisez un caractère générique (*) au lieu de caractères uniques dans les noms de fichiers. Le caractère générique représente zéro (0) occurrence ou plus de n'importe quel lettre, chiffre ou caractère spécial.

Exemple

FROM "Transactions_FY*.csv"

sélectionne :

Transactions_FY18.csv

Transactions_FY17.csv

Vous pouvez utiliser un caractère générique dans plusieurs emplacements d'un nom de fichier et dans une extension de fichier.

Exemple

FROM "Transactions_FY*.*"

sélectionne :

Transactions_FY18.txt

Transactions_FY17.csv

Fichiers de données source absents du dossier de projet Analytics racine

Si les fichiers de données source ne sont pas enregistrés dans le même dossier que le projet Analytics, vous devez utiliser un chemin d'accès absolu ou un chemin d'accès relatif au dossier contenant le projet pour indiquer l'emplacement des fichiers.

Exemple

FROM "C:\Point of Sale Audit\Données\Fichiers maîtres Transaction\Transactions_FY*.csv"
FROM "Données\Fichiers maîtres Transaction\Transactions_FY*.csv"

Dossier contenant les fichiers de données source

Au lieu d'indiquer des noms de fichier, vous pouvez simplement indiquer le nom du dossier contenant plusieurs fichiers de données source. Tous les fichiers délimités pris en charge dans le dossier sont importés (*.csv, *.dat, *.del, *.txt).

Pour indiquer un dossier de données source, utilisez un chemin d'accès au fichier absolu ou un chemin d'accès au fichier relatif au dossier contenant le projet Analytics.

Exemple

FROM "C:\Point of Sale Audit\Données\Fichiers maîtres Transaction"
FROM "Données\Fichiers maîtres Transaction"
encodage_car_source

Jeu de caractères et encodage des données source.

Selon l'édition d'Analytics que vous utilisez et selon l'encodage des données source, indiquez le code approprié :

Code Édition Analytics Encodage des données source
0

Édition non Unicode

toutes les données
0

édition Unicode

données ASCII
2 édition Unicode données Unicode, codage UTF-16 LE
3 code_numérique édition Unicode

données Unicode qui n'utilisent pas le codage UTF-16 Little Endian

Pour déterminer le code numérique correspondant à l'encodage des données source, effectuez une importation à l'aide de l'Assistant de définition des données, sélectionnez l'option Texte codé et recherchez l'encodage correspondant dans la liste déroulante.

Pour définir le code, indiquez 3, suivi d'un espace, et du code numérique.

Remarque

Si vous n'indiquez pas de code, Analytics non Unicode utilise automatiquement 0 et Analytics Unicode utilise automatiquement 2 .

SEPARATOR car | TAB | SPACE

Le caractère de séparation (délimiteur) utilisé entre les champs dans les données source. Vous devez indiquer le caractère sous forme de chaîne entre guillemets.

Vous pouvez indiquer une tabulation ou une espace comme séparateur en saisissant le caractère entre guillemets doubles ou en utilisant un mot clé :

  • SEPARATOR "   " ou SEPARATOR TAB
  • SEPARATOR " " ou SEPARATOR SPACE
QUALIFIER car | NONE

Caractère d'identificateur de texte utilisé dans les données source pour renvoyer à la ligne et identifier des valeurs de champs. Vous devez indiquer le caractère sous forme de chaîne entre guillemets.

Pour définir le caractère guillemet double comme identificateur de texte, placez le caractère à l'intérieur de guillemets simples : QUALIFIER '"'.

Vous pouvez spécifier qu'il n'y a pas de qualificatif de texte à l'aide de l'une de ces deux méthodes :

  • QUALIFIER ""
  • QUALIFIER NONE

CONSECUTIVE

optionnel

Les identificateurs de texte consécutifs sont traités en tant qu'identificateur unique.

STARTLINE numéro_ligne

Ligne à laquelle les données commencent.

Par exemple, si les quatre premières lignes de données contiennent des informations d'en-tête que vous ne souhaitez pas inclure, indiquez 5 pour numéro_ligne.

Remarque

Idéalement, la ligne de départ des données devrait être la même dans tous les fichiers délimités que vous importez avec une seule exécution d'IMPORT MULTIDELIMITED.

Si les lignes de départ sont différentes, consultez la rubrique Structure de fichiers cohérente requise.

KEEPTITLE

optionnel

Traitez le numéro de ligne spécifié par STARTLINE comme noms de champs plutôt que comme données. Si vous ignorez KEEPTITLE, les noms des champs génériques sont utilisés.

Remarque

Les noms des champs doivent se trouver sur le même numéro de ligne dans tous les fichiers délimités que vous importez avec une seule exécution d'IMPORT MULTIDELIMITED.

Si les noms de champ se trouvent sur différents numéros de ligne, consultez la rubrique Structure de fichiers cohérente requise.

CRCLEAR

optionnel

Remplace les caractères de retour chariot qui se trouvent entre les identificateurs de texte par des caractères espace. Vous devez indiquer QUALIFIER avec une valeur char pour utiliser CRCLEAR.

Si vous utilisez CRCLEAR et LFCLEAR, c'est CRCLEAR qui doit apparaître en premier.

LFCLEAR

optionnel

Remplace les caractères de saut de ligne qui se trouvent entre les identificateurs de texte par des caractères espace. Vous devez indiquer QUALIFIER avec une valeur char pour utiliser LFCLEAR.

Si vous utilisez CRCLEAR et LFCLEAR, c'est CRCLEAR qui doit apparaître en premier.

REPLACENULL

optionnel

Remplace les caractères NUL qui se trouvent dans le fichier délimité par des espaces. Le nombre de caractères NUL remplacés est enregistré dans la trace.

ALLCHAR

optionnel

Le type de données caractère est automatiquement attribué à tous les champs importés.

Astuce

Affecter le type de données caractère à tous les champs importés simplifie le processus d'importation des fichiers texte délimités. Une fois que les données sont dans Analytics, vous pouvez affecter différents types (Numérique ou DateHeure par exemple) de données aux champs et en spécifier les informations de format.

ALLCHAR s'avère utile si vous importez une table dans laquelle le type de données Numérique est affecté automatiquement aux champs des identificateurs par Analytics alors qu'en réalité, ils devraient utiliser le type de données Caractère.

Exemples

Dans les exemples qui suivent, on suppose que les données des transactions mensuelles sont stockées dans 12 fichiers délimités :

  • Transactions_Jan.csv vers Transactions_Dec.csv

Remarque

Une table Analytics distincte est créée pour fichier délimité que vous importez.

Importer tous les fichiers délimités

Vous voulez importer les 12 fichiers délimités. Vous utilisez le symbole caractère générique (*) à l'emplacement du mois dans le nom de chaque fichier

Analytics essaye d'attribuer le bon type de données à chaque champ.

IMPORT MULTIDELIMITED FROM "Transactions_*.csv" 0 SEPARATOR "," QUALIFIER '"' CONSECUTIVE STARTLINE 1 KEEPTITLE

Importer tous les fichiers délimités en tant que données de type caractère.

Cet exemple est identique au précédent, tout en montrant également comment Analytics attribue automatiquement le type de champ Caractère à tous les champs importés.

IMPORT MULTIDELIMITED FROM "Transactions_*.csv" 0 SEPARATOR "," QUALIFIER '"' CONSECUTIVE STARTLINE 1 KEEPTITLE ALLCHAR

Importer tous les fichiers délimités dans le dossier défini

Vous souhaitez importer tous les fichiers délimités dans le dossier C:\Point of sale audit\Data\Fichiers maîtres Transaction.

IMPORT MULTIDELIMITED FROM "C:\Point of sale audit\Data\Transaction master files" 0 SEPARATOR "," QUALIFIER '"' CONSECUTIVE STARTLINE 1 KEEPTITLE

Importez tous les fichiers délimités dans le dossier spécifié et enregistrez les tables Analytics dans un autre dossier

Cet exemple est le même que le précédent, mais au lieu d'enregistrer les tables Analytics dans le dossier de projet racine, vous voulez les enregistrer dans le dossier C:\Point of Sale Audit\Données\Données de travail transaction.

IMPORT MULTIDELIMITED FROM "C:\Point of sale audit\Data\Transaction working data" FROM "C:\Point of sale audit\Data\Transaction master files" 0 SEPARATOR "," QUALIFIER '"' CONSECUTIVE STARTLINE 1 KEEPTITLE

Remarques

Structure de fichiers cohérente requise

Pour importer proprement un groupe de fichiers délimités à l'aide d'IMPORT MULTIDELIMITED, la structure de tous les fichiers du groupe doit être cohérente.

Vous pouvez importer des fichiers délimités dont la structure est incohérente, puis effectuer le nettoyage des données et leur standardisation dans Analytics. Toutefois, cette approche peut être génératrice de pas mal de travail. Dans la plupart des cas, il est plus simple d'assurer la cohérence des fichiers délimités avant l'importation.

Pour importer proprement plusieurs fichiers délimités, les éléments suivants doivent être cohérents sur l'ensemble des fichiers :

Élément Mot-clé ACLScript Problème Solution

Jeu de caractères et encodage des données source

code numérique

(édition Unicode d'Analytics uniquement)

Les fichiers délimités source utilisent diffents encodages de caractère. Par exemple, certains fichiers ont un encodage ASCII alors que d'autres un encodage Unicode.

Regroupez les fichiers source par type d'encodage et lancez un import distinct pour chaque groupe.
Caractère délimiteur SEPARATOR Les fichiers délimités source utilisent un caractère de séparation différent (séparateur) entre les champs.

Effectuez l'une des actions suivantes :

  • Standardisez le séparateur de champs dans les fichiers source avant de les importer.
  • Regroupez les fichiers source par séparateur de champs et lancez un import distinct pour chaque groupe.
Caractère des identificateurs de texte QUALIFIER Les fichiers délimités source utilisent un caractère d'identification de texte pour renvoyer à la ligne et identifier des valeurs de champs.

Effectuez l'une des actions suivantes :

  • Standardisez l'identificateur de texte dans les fichiers source avant de les importer.
  • Regroupez les fichiers source par identificateur de texte et lancez un import distinct pour chaque groupe.
Ligne de départ des données STARTLINE

Les fichiers délimités source ont différentes lignes de départ des données.

Effectuez l'une des actions suivantes :

  • Standardisez la ligne de départ dans les fichiers source avant de les importer.
  • Regroupez les fichiers source ayant des lignes de départ identiques et lancez un import distinct pour chaque groupe.
  • Faites en sorte que numéro_ligne soit égal à la plus petite ligne de départ parmi tous les fichiers. Une fois que les fichiers ont été importés dans les tables Analytics, vous pouvez utiliser Commande EXTRACT pour extraire uniquement les enregistrements de toutes les tables contenant des informations d'en-tête indésirables.
Nom des champs KEEPTITLE Les fichiers délimités source ont des noms de champs sur différents numéros de ligne.

Effectuez l'une des actions suivantes :

  • Standardisez les numéros de ligne avec les noms de champs dans les fichiers source avant de les importer.
  • Regroupez les fichiers source ayant des noms de champs sur les mêmes numéros de ligne et lancez un import distinct pour chaque groupe.
Nom des champs KEEPTITLE Des fichiers délimités source ont des noms de champ et d'autres pas.

Effectuez l'une des actions suivantes :

  • Ajoutez les noms de champ aux fichiers source qui le nécessitent avec d'importer tous les fichiers.
  • Regroupez les fichiers source ayant des noms de champs, et ceux qui n'en ont pas, et lancez un import distinct pour chaque groupe.
  • Otez l'option KEEPTITLE afin d'importer tous les fichiers en utilisant des noms de champ générique. Une fois que les fichiers ont été importés dans les tables Analytics, vous pouvez utiliser Commande EXTRACT pour extraire uniquement les données que vous souhaitez depuis n'importe quelle table.

Commandes IMPORT DELIMITED multiples

La commande IMPORT MULTIDELIMITED exécute en fait plusieurs commandes IMPORT MULTIDELIMITED individuelles, une pour chaque fichier importé. Si vous double-cliquez sur l'entrée IMPORT MULTIDELIMITED dans le fichier journal, chaque commande IMPORT MULTIDELIMITED s'affiche individuellement dans la zone d'affichage.

Combiner plusieurs fichiers délimités après les avoir importés

Après avoir importé plusieurs fichiers délimités dans des tables Analytics individuelles, vous voudrez peut-être les combiner en une seule table Analytics. Par exemple, vous pouvez combiner les données de douze tables mensuelles en une seule table annuelle contenant toutes les données.

Pour obtenir des informations sur la combinaison de plusieurs tables Analytics, consultez la rubrique Commande APPEND.

Guide de création de scripts ACL 14.1