Comando IMPORT PDF

Crea una tabla de Analytics definiendo e importando un archivo de Adobe PDF.

Sintaxis

IMPORT PDF TO tabla <PASSWORD núm> nombrearchivo_importación FROM nombrearchivo_origen <SERVER nombre_perfil> longitud_omisión <PARSER "VPDF"> <PAGES intervalo_páginas> {[sintaxis_registro] [sintaxis_campo] <...n>} <...n>
sintaxis_registro ::=
RECORD nombre_del_registro tipo_de_registro líneas_en_el_registro transparente [sintaxis_prueba]<...n>
sintaxis_prueba ::=
TEST incluir_excluir tipo_de_coincidencia AT línea_de_inicio;posición_inicial;rango lógica texto
sintaxis_campo ::=
FIELD nombre tipo AT línea_de_inicio; posición_inicial SIZE longitud; líneas_en_el_campo DEC valor WID bytes PIC formato AS nombre_visible

Parámetros

Parámetros generales

Nombre Descripción
TO tabla

El nombre de la tabla de Analytics a la que se importarán los datos.

Nota

Los nombres de tabla tienen un límite máximo de 64 caracteres alfanuméricos. El nombre puede incluir un guión bajo ( _ ), pero no puede incluir ningún otro carácter especial ni espacios. El nombre no puede comenzar con un número.

PASSWORD núm

opcional

Se utiliza para archivos PDF protegidos con contraseña.

La definición de contraseña que se debe usar.

No se utiliza PASSWORD núm para solicitar o especificar una contraseña real. La definición de contraseña hace referencia a una contraseña proporcionada o configurada previamente con el comando PASSWORD, el comando SET PASSWORD o la etiqueta de estudio analítico PASSWORD.

núm es el número de la definición de contraseña. Por ejemplo, si se proporcionaron o configuraron dos contraseñas previamente en un script, o al programar un estudio analítico, PASSWORD 2 especifica que se utiliza la contraseña #2.

Si desea obtener más información acerca de la especificación o configuración de contraseñas, consulte:

nombrearchivo_importación

El nombre del archivo de datos de Analytics que se debe crear.

Especifique nombrearchivo_importación como una cadena entre comillas con una extensión de archivo .FIL. Por ejemplo: "Facturas.FIL".

Por valor predeterminado, el archivo de datos (.FIL) se guarda en la carpeta que contiene el proyecto de Analytics.

Utilice una ruta de archivo absoluta o relativa para guardar el archivo de datos en una carpeta existente o una diferente:

  • "C:\datos\Facturas.FIL"
  • "datos\Facturas.FIL"

FROM nombrearchivo_origen

El nombre del archivo de datos de origen. nombrearchivo_origen debe ser una cadena entre comillas.

Si el archivo de datos de origen no está ubicado en el mismo directorio que el proyecto Analytics, debe utilizar una ruta de acceso absoluta o una ruta de acceso relativa para especificar la ubicación del archivo:

  • "C:\datos\nombrearchivo_origen"
  • "datos\nombrearchivo_origen"
SERVER nombre_perfil

opcional

El nombre de perfil para el servidor que contiene los datos que desea importar.
longitud_omisión

opcional

El número de bytes que se omitirán al inicio del archivo.

Por ejemplo, si los primeros 32 bytes contienen información del encabezado, especifique un valor de longitud de omisión de 32 para omitir esta información.

Nota

Para los datos Unicode, especifique solo un número par de bytes. Si especifica un número de bytes impar puede provocar problemas con el procesamiento posterior de los datos importados.

PARSER "VPDF"

opcional

Use el analizador VeryPDF para analizar el archivo PDF durante el proceso de definición del archivo.

Si omite PARSER, se utilizará el analizador Xpdf predeterminado.

Si está importando el archivo PDF por primera vez y no tiene motivos para hacerlo de otra manera, utilice el analizador predeterminado Xpdf. Si ya detectó problemas de alineación de los datos al utilizar Xpdf, use el analizador VeryPDF para ver si los resultados del análisis son mejores.

PAGES intervalo_páginas

opcional

Las páginas que se deben incluir si no se desea importar todas las páginas del archivo PDF. intervalo_páginas se debe especificar como una cadena entre comillas.

Puede especificar:

  • páginas individuales separadas por comas (1,3,5)
  • intervalos de páginas (2-7)
  • una combinación de páginas e intervalos (1, 3, 5-7, 11)

Si omite PAGES, se importan todas las páginas del archivo PDF.

Parámetro RECORD

Información de la definición del registro general.

Nota

Parte de la información de definición del registro se especifica utilizando códigos numéricos que coinciden con las opciones del Asistente de Definición de Datos.

En los scripts, especifique el código numérico, no el nombre de la opción.

Nombre Descripción

RECORD nombre_del_registro

El nombre del registro en el Asistente de Definición de Datos.

Es necesario especificar el nombre_del_registro en el comando IMPORT PDF, pero el valor nombre_del_registro no aparece en la tabla de Analytics que se obtiene como resultado.

En el Asistente de Definición de Datos, Analytics proporciona nombres predeterminados sobre la base del tipo de registro:

  • Detalle
  • Encabezadon
  • Pie de páginan

Puede usar los nombres predeterminados o especificar nombres diferentes.

tipo_de_registro

Los tres tipos de registro posibles al definir un archivo PDF:

  • 0: detalle
  • 1: encabezado
  • 2: pie de página

Nota

Puede definir varios conjuntos de registros de encabezado y pie de página en una única ejecución de IMPORT PDF, pero solo un conjunto de registros de detalle.

líneas_en_el_registro

La cantidad de líneas que ocupa un registro en el archivo PDF.

Puede definir registros de una o varias líneas para que coincidan con los datos del archivo PDF.

transparente

El ajuste de transparencia para un registro de encabezado.

Nota

Se aplica únicamente a los registros de encabezado.

  • 0: no transparente
  • 1: transparente

Los registros de encabezado transparentes no separan los registros de detalle de varias líneas.

Si un registro de encabezado separa un registro de detalle de varias líneas del archivo PDF de origen, lo cual puede ocurrir cuando hay un salto de página, al especificar 1 (transparente), se unifica el registro de detalle de la tabla de Analytics resultante.

Parámetro TEST

Los criterios para definir un conjunto de registros en el archivo PDF. Puede tener una o más instancias de TEST (hasta 8) para cada instancia de RECORD.

Nota

Algunos de los criterios se especifican utilizando códigos numéricos que asignan las opciones del Asistente de Definición de Datos (los nombres de las opciones se muestran a continuación entre paréntesis).

En los scripts, especifique el código numérico, no el nombre de la opción.

Nombre Descripción
TEST incluir_excluir

Cómo tratar los datos coincidentes:

  • 0: (Incluir) los datos que reúnen los criterios se incluyen en el conjunto de registros
  • 1: (Excluir) los datos que reúnen los criterios se excluyen del conjunto de registros
tipo_de_coincidencia

El tipo de coincidencia que se debe aplicar:

  • 0: (Concordancia exacta) los registros coincidentes deben contener el carácter o la cadena de caracteres especificados en la línea de inicio especificada, comenzando en la posición inicial especificada
  • 2: (Alfabético) los registros coincidentes deben contener uno o más caracteres alfabéticos en la línea de inicio especificada, en la posición inicial especificada o en todas las posiciones del rango especificado
  • 3: (Numérico) los registros coincidentes deben contener uno o más caracteres numéricos en la línea de inicio especificada, en la posición inicial especificada o en todas las posiciones del rango especificado
  • 4: (En blanco) los registros coincidentes deben contener uno o más espacios en blanco en la línea de inicio especificada, en la posición inicial especificada o en todas las posiciones del rango especificado
  • 5: (No en blanco) los registros coincidentes deben contener uno o más espacios de caracteres que no estén en blanco (incluidos los caracteres especiales), en la línea de inicio especificada, en la posición inicial especificada o en todas las posiciones del rango especificado
  • 7: (Buscar en línea) los registros coincidentes deben contener el carácter o la cadena de caracteres especificados en cualquier lugar de la línea de inicio especificada
  • 8: (Buscar en rango) los registros coincidentes deben contener el carácter o la cadena de caracteres especificados en la línea de inicio especificada, en cualquier lugar del rango especificado
  • 10: (Búsqueda con comodines) los registros coincidentes deben contener caracteres que coincidan con el patrón de caracteres especificado, en la línea de inicio especificada, comenzando en la posición especificada
AT línea_de_inicio; posición_inicial; rango
  • línea_de_inicio la línea del registro a la que se aplican los criterios

    Por ejemplo, si crea una búsqueda con comodines para que coincidan con códigos postales y los códigos postales aparecen en la tercera línea de un registro de tres líneas, debe especificar 3 en línea_de_inicio.

    Nota

    En el caso de registros de una sola línea, el valor de línea_de_inicio es siempre 1.

  • posición_inicial la posición inicial en bytes del archivo PDF para la comparación con los criterios
  • rango la cantidad de bytes a partir de la posición inicial de bytes en el archivo PDF que se debe usar en la comparación con los criterios

    Si está utilizando únicamente la posición de bytes de inicio, sin un rango, especifique 0 para rango.

    Nota

    Analytics no Unicode1 byte = 1 carácter
    Analytics Unicode2 bytes = 1 carácter
lógica

Las relaciones lógicas entre los criterios:

  • 0: (Y) el criterio actual y el siguiente se relacionan con un AND lógico
  • 1: (O) el criterio actual y el siguiente se relacionan con un OR lógico
  • 4: (Nuevo grupo > Y) el criterio actual es el último de un grupo de criterios lógicos y el grupo actual y el grupo siguiente están relacionados con un AND lógico
  • 5: (Nuevo grupo > O) el criterio actual es el último de un grupo de criterios lógicos y el grupo actual y el siguiente se relacionan con un OR lógico
  • 7: (Fin) el criterio actual es el último de un grupo de criterios lógicos
texto

Caracteres literales o comodín con los que se debe buscar una coincidencia:

  • Para Concordancia exacta, Buscar en línea o Buscar en rango, especifica el carácter o la cadena de caracteres que identifican de manera exclusiva al conjunto de registros del archivo PDF.
  • Para Búsqueda con comodines, especifica el patrón de caracteres que identifican de manera exclusiva el conjunto de registros del archivo PDF

    La opción Búsqueda con comodines usa la misma sintaxis que la Función MAP( ).

Para otros tipos de coincidencias, texto es una cadena vacía "".

Parámetros FIELD

Información de la definición de campo.

Nombre Descripción
FIELD nombre tipo

Los campos individuales para importar desde el archivo de datos de origen, incluidos el nombre y el tipo de datos del campo. Para excluir un campo de la importación, no lo especifique.

Si desea obtener información acerca de los tipos, consulte Identificadores de los tipos de datos de los campos.

AT línea_de_inicio; posición_inicial
  • línea_de_inicio la línea de inicio del campo del registro del archivo PDF

    En el caso de registros de varias líneas en un archivo PDF, línea_de_inicio le permite comenzar un campo en cualquier línea del registro. línea_de_inicio siempre es 1 si líneas_en_el_registro es 1.

  • posición_inicial la posición inicial en bytes del campo en el archivo PDF

    Nota

    Analytics no Unicode1 byte = 1 carácter
    Analytics Unicode2 bytes = 1 carácter

    En general, en Analytics Unicode, debe especificar una posición de byte de inicio impar. Si especifica una posición de inicio par, es posible que los caracteres no se vean correctamente.

SIZE longitud; líneas_en_el_campo
  • longitud la longitud del campo en bytes en el formato de tabla de Analytics

    Nota

    Analytics no Unicode 1 byte = 1 carácter
    Analytics Unicode 2 bytes = 1 carácter

    En Analytics Unicode, especifique solo un número par de bytes. Si especifica un número de bytes impar, es posible que los caracteres no se vean correctamente.

  • líneas_en_el_campo la cantidad de líneas ocupadas por un valor de campo individual en el archivo PDF

    Puede definir campos de una o varias líneas para hacer coincidir con los datos del archivo.

    Nota

    La cantidad de líneas especificadas para un campo no puede superar la cantidad de líneas especificadas para el registro que contiene el campo.

DEC valor

La cantidad de lugares decimales para los campos numéricos.

WID bytes

El ancho visible del campo en bytes.

El valor que se especifica controla el ancho visible del campo en las vistas y reportes de Analytics. El ancho visible nunca altera los datos; sin embargo, si es más pequeño que la longitud del campo, es posible que oculte datos.

PIC formato

Nota

Se aplica solo a campos numéricos o de fechahora.

  • campos numéricos el formato de visualización de los valores numéricos en las vistas y los reportes de Analytics
  • campos de fechahora el formato físico de los valores de fechahora en los datos de origen (orden de los caracteres de fecha y hora, los separadores, etc.)

    Nota

    Para los campos de fechahora, el formato debe coincidir exactamente con el formato físico de los datos de origen. Por ejemplo, si los datos de origen son 12/31/2014, debe ingresar el formato como MM/DD/AAAA.

formato debe estar encerrado entre comillas.

AS nombre_visible

El nombre visible (título de columna alternativo) para el campo en la vista de la nueva tabla de Analytics.

Especifique nombre_visible como una cadena entre comillas. Utilice un punto y coma (;) entre las palabras si desea que haya un salto de línea en el título de la columna.

AS es obligatorio cuando se está definiendo un FIELD. Para que el nombre visible sea el mismo que el nombre del campo, introduzca un valor en blanco en nombre_visible con la siguiente sintaxis: AS "". Asegúrese de que no haya un espacio entre las dos comillas.

Ejemplos

Importación de datos de una página específica de un archivo PDF

Usted importa datos de la página 1 del archivo PDF protegido con contraseña, Proveedores.pdf.

Se crea un conjunto de registros de detalles, con tres campos, en la tabla de Analytics resultante, Lista_proveedores:

IMPORT PDF TO Lista_proveedores PASSWORD 1 "Lista_proveedores.FIL" FROM "Proveedores.pdf" 2 PAGES "1" RECORD "Detalle" 0 1 0 TEST 0 3 AT 1;1;0 7 "" FIELD "Número_proveedor" C AT 1;1 SIZE 10;1 DEC 0 WID 10  PIC "" AS "" FIELD "Nombre_proveedor" C AT 1;33 SIZE 58;1 DEC 0 WID 58  PIC "" AS "" FIELD "Última_fecha_activa" D AT 1;277 SIZE 20;1 DEC 0 WID 20  PIC "DD/MM/AAAA" AS ""

Observaciones

Nota

Si desea obtener más información sobre la forma en la que funciona este comando, consulte Guía de ayuda.

Solución de problemas con importaciones de PDF en la edición Unicode de Analytics

Si detecta problemas al importar un archivo PDF con la edición Unicode de Analytics, el problema puede estar relacionado con las especificaciones de longitud:

  • Si aparecen inesperadamente caracteres de un idioma extranjero o el formato de la tabla de Analytics que se obtiene está inclinado, compruebe que SIZE longitud esté ajustada en un número par.

    Si especifica un número de bytes impar para SIZE longitud, puede provocar problemas con el procesamiento de los datos importados.

  • Si se crea la tabla de Analytics, pero esta no contiene ningún registro, intente ajustar longitud_omisión en 2 o en otro número par si hay datos de encabezado al principio del archivo y usted desea saltearlos.

Identificadores de los tipos de datos de los campos

La siguiente tabla incluye las letras que debe usar al especificar el tipo para FIELD. Cada letra corresponde a un tipo de datos de Analytics.

Por ejemplo, si está definiendo un campo Apellido, que necesita tipos de datos de carácter, especificará "C": FIELD "Apellido" C.

Si desea obtener más información, consulte Tipos de datos de Analytics.

Nota

Cuando utilice el Asistente de definición de datos para definir una tabla que incluya campos EBCDIC, Unicode o ASCII, se le asignará la letra "C" automáticamente a los campos (correspondiente al tipo CHARACTER [carácter]).

Al ingresar manualmente un enunciado IMPORT o editar un enunciado IMPORT existente, puede utilizar los valores más específicos de las letras "E" o "U" en lugar de los campos EBCDIC o Unicode.

Letra

Tipo de datos de Analytics

A

ACL

B

BINARY (binario)

C

CHARACTER (carácter)

D

DATETIME

E

EBCDIC

F

FLOAT (flotante)

G

ACCPAC

I

IBMFLOAT

K

UNSIGNED

L

LOGICAL

N

PRINT

P

PACKED (compactado)

Q

BASIC

R

MICRO

S

CUSTOM

T

PCASCII

U

UNICODE

V

VAXFLOAT

X

NUMERIC (numérico)

Y

UNISYS

Z

ZONED (zonado)