Definición e importación de subconjuntos de datos de imagen de impresión o PDF

Si la definición de un conjunto completo de registros en un archivo de imagen de impresión o PDF es difícil o incluso imposible debido a la falta de alineación de los datos, puede definir e importar varios subconjuntos de datos desde el archivo. En Analytics, puede anexar las tablas de Analytics resultantes para ensamblar un conjunto de datos completo.

Esta técnica funciona mejor si el archivo de origen del Asistente de Definición de Datos contiene bloques de registros en los cuales todos los campos están alineados dentro de cada bloque. Si los datos están incorrectamente alineados de manera más aleatoria, consulte Definición de campos incorrectamente alineados en un archivo de imagen de impresión o PDF.

Consejo:

Para definir un archivo PDF, puede optar por analizar el archivo PDF página por página. En algunos casos, la falta de alineación de los datos ocurre en los saltos de página. Tal vez pueda resolver un problema de alineación utilizando subconjuntos de datos del tamaño de una página.

Para definir e importar un subconjunto de datos de imagen de impresión o PDF:

  1. Realice el proceso de definición e importación de la manera habitual, con estas diferencias:

    Defina e importe el mismo archivo varias veces.

    Con cada repetición, defina un subconjunto diferente de registros. Los campos de cada subconjunto deben estar internamente alineados.

    Un subconjunto de registros no necesita ser contiguo. Por ejemplo, los campos de los registros ubicados al principio y al final de un archivo podrían estar alineados entre sí, pero desalineados con respecto a campos ubicados en la mitad del archivo.

    Diseñe un método para hacer un seguimiento de qué registros se incluyen en cada subconjunto.

    Si captura sin querer el mismo registro más de una vez, puede eliminar los registros duplicados del conjunto de datos reorganizado en Analytics. Si desea obtener más información, consulte Quitar duplicados.

    Con cada repetición, asegúrese de que la estructura de datos conserve la uniformidad.

    Asegúrese de que el nombre, la longitud, el tipo de datos y el orden de los campos correspondientes continúen siendo uniformes. Mantener esta uniformidad de la estructura de los datos hace que resulte más fácil anexar las tablas de Analytics resultantes.

    Consejo:

    Después de importar el primer subconjunto, abra la tabla resultante en Analytics y escriba DISPLAY en la línea de comandos para mostrar la estructura de los datos del formato de tabla. Utilice la información de formato de tabla que se muestra como orientación para crear los siguientes subconjuntos de registros y campos.

    Para ahorrar trabajo, utilice los nombres de campo genéricos de Analytics (“Field_1”, “Field_2”, etc) al definir e importar subconjuntos de registros. Una vez que haya reorganizado el conjunto de datos en Analytics, puede volver a nombrar todos los campos en la tabla reorganizada.

  2. Al guardar cada archivo de datos de Analytics y cada formato de tabla de Analytics, utilice un sufijo numérico creciente para evitar sobrescribir las tablas que ya creó. Por ejemplo, “Table_1.fil”, “Table_2.fil”, etc.
  3. Una vez que haya definido e importado todos los registros del archivo de origen, anexe las diferentes tablas de Analytics.

    Si desea obtener más información, consulte Extracción y adición de datos.