Comando IMPORT PDF

Informações do conceito

Definir e importar um arquivo PDF

Cria uma tabela do Analytics definindo e importando um arquivo Adobe PDF.

Sintaxe

IMPORT PDF TO tabela <PASSWORD num> nome_arquivo_importação FROM nome_arquivo_origem <SERVER nome_perfil> ignorar_comprimento <PARSER "VPDF"> <PAGES intervalo_de_páginas> {[sintaxe_registro] [sintaxe_campo] <...n>} <...n>
sintaxe_registro ::=
RECORD nome_registro tipo_registro linhas_no_registro transparente [sintaxe_teste] <...n>
sintaxe_teste ::=
TEST incluir_excluir tipo_correspondência AT linha_inicial,posição_inicial,intervalo lógica texto
sintaxe_campo ::=
FIELD nome tipo AT linha_inicial,posição_inicial SIZE comprimento,linhas_no_campo DEC valor WID bytes PIC formato AS nome_exibicao

Parâmetros

Parâmetros gerais

Nome Descrição
TO tabela

O nome da tabela do Analytics na qual os dados serão importados.

Nota

Os nomes de tabela são limitados a 64 caracteres alfanuméricos. O nome pode incluir o caractere de sublinhado ( _ ) mas nenhum outro caractere especial e nenhum espaço. O nome não pode começar com um número.

PASSWORD num

opcional

Usado para arquivos PDF protegidos por senha.

A definição de senha a ser usada.

PASSWORD num não é usado para solicitar ou especificar uma senha real. A definição de senha faz referência a uma senha previamente fornecida ou definida com o comando PASSWORD, o comando SET PASSWORD ou a tag de análise PASSWORD.

num é o número da definição de senha. Por exemplo, se as duas senhas foram previamente fornecidas ou definidas em um script, ou no agendamento de uma análise, PASSWORD 2 especifica o uso da senha nº 2.

Para obter mais informações sobre o fornecimento ou a definição de senhas, consulte:

nomearquivo_importação

O nome do arquivo de dados do Analytics a ser criado.

Especifique nome_arquivo_importação como uma cadeia entre aspas com uma extensão de arquivo .FIL. Por exemplo, "Faturas.FIL".

Por padrão, o arquivo de dados (.FIL) é salvo na pasta que contém o projeto do Analytics.

Use um caminho de arquivo absoluto ou relativo para salvar o arquivo de dados em uma pasta diferente já existente:

  • "C:\dados\Faturas.FIL"
  • "dados\Faturas.FIL"

FROM nome_arquivo_origem

O nome do arquivo de dados de origem. nome_arquivo_origem deve ser uma cadeia entre aspas.

Se o arquivo de dados de origem não está localizado no mesmo diretório que o projeto do Analytics, é necessário usar um caminho absoluto para especificar a localização do arquivo:

  • "C:\dados\nome_arquivo_origem"
  • "dados\nome_arquivo_origem"
SERVER nome_perfil

opcional

O nome do perfil do servidor onde estão os dados que você quer importar.
ignorar_comprimento

opcional

O número de bytes a ser ignorado no início do arquivo.

Por exemplo, se os primeiros 32 bytes contêm informações de cabeçalho, especifique um valor de comprimento a ignorar de 32 para omitir essas informações.

Nota

Para dados Unicode, especifique apenas um número de bytes par. A especificação de um número de bytes ímpar pode causar problemas no processamento subsequente dos dados importados.

PARSER "VPDF"

opcional

Use o analisador VeryPDF para analisar o arquivo PDF durante o processo de definição de arquivo.

Se você omitir PARSER, será usado o analisador padrão Xpdf.

Se você está importando o arquivo PDF pela primeira vez e não tiver motivo para proceder de outra forma, use o analisador padrão Xpdf. Se você já encontrou problemas de alinhamento de dados usando o Xpdf com o arquivo, use o analisador VeryPDF para verificar se os resultados da análise são melhores.

PAGES intervalo_de_páginas

opcional

As páginas a serem incluídas quando você não quer incluir todas as páginas do arquivo PDF. intervalo_de_páginas deve ser especificado como uma cadeia entre aspas.

Você pode especificar:

  • páginas individuais separadas por vírgulas (1,3,5)
  • intervalos de páginas (2-7)
  • uma combinação de páginas e intervalos (1, 3, 5-7, 11)

Se você omitir PAGES, todas as páginas do arquivo PDF serão importadas.

Parâmetro RECORD

Informações gerais sobre definição de registros.

Nota

Algumas informações de definição de registros são especificadas usando códigos numéricos associados a opções no Assistente de Definição de Dados.

Em scripts, especifique o código numérico e não o nome da opção.

Nome Descrição

RECORD nome_registro

O nome do registro no Assistente de Definição de Dados.

É necessário especificar nome_registro no comando IMPORT PDF, mas o valor nome_registro não aparece na tabela do Analytics resultante.

No Assistente de Definição de Dados, o Analytics oferece nomes padrão de acordo com o tipo de registro:

  • Detalhes
  • Cabeçalhon
  • Rodapén

Você pode usar os nomes padrão ou especificar nomes diferentes.

tipo_registro

Os três tipos de registro possíveis ao definir um arquivo PDF:

  • 0 – detalhe
  • 1 – cabeçalho
  • 2 – rodapé

Nota

Você pode definir vários conjuntos de registros de cabeçalho e rodapé em uma única execução de IMPORT PDF, mas apenas um conjunto de registros de detalhe.

linhas_no_registro

O número de linhas ocupadas em um registro no arquivo PDF.

Você pode definir registros de uma única linha ou de várias linhas para corresponder aos dados no arquivo PDF.

transparente

A definição de transparência para um registro de cabeçalho.

Nota

Aplicável apenas a registros de cabeçalho.

  • 0 – não transparente
  • 1 – transparente

Os registros de cabeçalho transparentes não dividem registros de detalhe de várias linhas.

Se um registro de cabeçalho dividir um registro de detalhe de várias linhas no arquivo PDF de origem, o que poderá acontecer na quebra de página, a especificação de 1 (transparente) unificará o registro de detalhe na tabela do Analytics resultante.

Parâmetro TEST

Os critérios para definir um conjunto de registros no arquivo PDF. Você pode ter uma ou mais (até 8) ocorrências de TEST para cada ocorrência de RECORD.

Nota

Alguns critérios são especificados usando códigos numéricos associados a opções no Assistente de Definição de Dados (os nomes das opções são mostrados abaixo entre parênteses).

Em scripts, especifique o código numérico e não o nome da opção.

Nome Descrição
TEST incluir_excluir

Como tratar dados correspondentes:

  • 0 – (Incluir) dados que cumprem os critérios são incluídos no conjunto de registros
  • 1 – (Excluir) dados que cumprem os critérios são excluídos do conjunto de registros
tipo_correspondência

O tipo de correspondência a ser executada:

  • 0 – (Correspondência exata) os registros correspondentes devem conter o caractere especificado ou a cadeia de caracteres especificada, na linha inicial especificada e a partir da posição especificada
  • 2 – (Alfa) os registros correspondentes devem conter um ou mais caracteres alfabéticos na linha inicial especificada, na posição inicial especificada ou em todas as posições do intervalo especificado
  • 3 – (Numérico) os registros correspondentes devem conter um ou mais caracteres numéricos na linha inicial especificada, na posição inicial especificada ou em todas as posições do intervalo especificado
  • 4 – (Em branco) os registros correspondentes devem conter um ou mais espaços em branco na linha inicial especificada, na posição inicial especificada ou em todas as posições do intervalo especificado
  • 5 – (Não em branco) os registros correspondentes devem conter um ou mais caracteres não em branco (incluindo caracteres especiais) na linha inicial especificada, na posição inicial especificada ou em todas as posições do intervalo especificado
  • 7 – (Encontrar na linha) os registros correspondentes devem conter o caractere especificado ou a cadeia de caracteres especificada em qualquer lugar da linha inicial especificada
  • 8 – (Encontrar no intervalo) os registros correspondentes devem conter o caractere especificado ou a cadeia de caracteres especificada, na linha inicial especificada, em qualquer lugar dentro do intervalo especificado
  • 10 – (Mapa personalizado) os registros correspondentes devem conter caracteres que correspondem ao padrão de caracteres especificado, na linha inicial especificada e a partir da posição especificada
AT linha_inicial, posição_inicial, intervalo
  • linha_inicial a linha de um registro ao qual os critérios se aplicam

    Por exemplo, se você criar um mapa personalizado para corresponder CEPs, e os CEPs forem exibidos na terceira linha de um registro de três linhas, você deverá especificar 3 em linha_inicial.

    Nota

    Para registros de uma única linha, o valor de linha_inicial é sempre 1.

  • posição_inicial a posição inicial em bytes no arquivo PDF para comparação com os critérios
  • intervalo o número de bytes a partir da posição inicial em bytes no arquivo PDF usada na comparação com os critérios

    Se você estiver usando apenas a posição inicial em bytes, sem um intervalo, especifique 0 como intervalo.

    Nota

    Analytics não Unicode1 byte = 1 caractere
    Analytics Unicode2 bytes = 1 caractere
lógica

As relações lógicas entre os critérios:

  • 0 – (E) os critérios atual e próximo são relacionados com um AND lógico
  • 1 – (Ou) os critérios atual e próximo são relacionados com um OR lógico
  • 4 – (Novo grupo > E) o critério atual é o último em um grupo de critérios lógicos, e os grupos atual e próximo são relacionados com um AND lógico
  • 5 – (Novo grupo > Ou) o critério atual é o último em um grupo de critérios lógicos, e os grupos atual e próximo são relacionados com um OU lógico
  • 7 – (Fim) o critério atual é o último em um grupo de critérios lógicos
texto

Caracteres literais ou curinga para correspondência:

  • Em Correspondência exata, Encontrar na linha ou Encontrar no intervalo especifica o caractere ou a cadeia de caracteres que identifica unicamente o conjunto de registros no arquivo PDF
  • Em Mapa personalizado especifica o padrão de caracteres que identifica unicamente o conjunto de registros no arquivo PDF

    A opção Mapa personalizado usa a mesma sintaxe de Função MAP( ).

Para outros tipos de correspondência, o texto é uma cadeia vazia "".

Parâmetros de FIELD

Informações de definição de campo.

Nome Descrição
FIELD nome tipo

Os campos individuais no arquivo de dados de origem a importar, incluindo o nome e o tipo de dados do campo. Para excluir um campo da importação, não o especifique.

Para obter mais informações sobre tipo, consulte Identificadores para os tipos de dados de campo.

AT linha_inicial, posição_inicial
  • linha_inicial a linha inicial do campo no registro do arquivo PDF

    Para registros de várias linhas em um arquivo PDF, linha_inicial permite iniciar um campo em qualquer linha do registro. linha_inicial será sempre 1 se linhas_no_registro for 1.

  • posição_inicial a posição inicial em bytes do campo no arquivo PDF

    Nota

    Analytics não Unicode1 byte = 1 caractere
    Analytics Unicode2 bytes = 1 caractere

    No Analytics Unicode, normalmente você deve especificar uma posição inicial em bytes ímpar. A especificação de uma posição inicial par pode causar exibição incorreta de caracteres.

SIZE comprimento, linhas_no_campo
  • comprimento o comprimento em bytes do campo no layout da tabela do Analytics

    Nota

    Analytics não Unicode 1 byte = 1 caractere
    Analytics Unicode 2 bytes = 1 caractere

    No Analytics Unicode, especifique apenas um número de bytes par. A especificação de um número ímpar de bytes pode causar exibição incorreta de caracteres.

  • linhas_no_campo o número de linhas ocupadas por um único valor de campo no arquivo PDF

    Você pode definir registros de uma única linha ou de várias linhas para corresponder aos dados no arquivo.

    Nota

    O número de linhas especificado para um campo não pode exceder o número de linhas especificado para o registro que contém o campo.

DEC valor

O número de casas decimais para campos numéricos.

WID bytes

A largura de exibição do campo em bytes.

O valor especificado controla a largura de exibição do campo em exibições e relatórios do Analytics. A largura de exibição nunca altera os dados. No entanto, pode ocultá-los se for menor que o comprimento do campo.

PIC formato

Nota

Aplica-se somente a campos numéricos ou de datahora.

  • campos numéricos o formato de exibição de valores numéricos em exibições e relatórios do Analytics
  • campos datahora o formato físico dos valores datahora nos dados de origem (ordem de caracteres de data e hora, separadores e assim por diante)

    Nota

    Para campos de datahora, formato deve corresponder exatamente ao formato físico dos dados de origem. Por exemplo, se os dados de origem são 31/12/2014, você deve inserir o formato como "DD/MM/AAAA".

formato deve estar entre aspas.

AS nome_exibicao

O nome de exibição (título alternativo da coluna) para o campo na exibição na nova tabela do Analytics.

Especifique nome_exibicao como uma cadeia entre aspas. Utilize um ponto e vírgula (;) entre palavras se quiser uma quebra de linha no título da coluna.

AS é obrigatório na definição de um FIELD. Para que o nome de exibição seja igual ao nome do campo, insira um valor de nome_exibicao em branco usando a seguinte sintaxe: AS "". Verifique se não há espaço entre as duas aspas.

Exemplos

Importação de dados de uma página específica de um arquivo PDF

Importe dados da página 1 de um arquivo PDF protegido por senha, Fornecedores.pdf.

Um conjunto de registros de detalhes, com três campos, é criado na tabela do Analytics resultante, Lista_Fornecedores:

IMPORT PDF TO Lista_Fornecedores PASSWORD 1 "Lista_Fornecedores.FIL" FROM "Fornecedores.pdf" 2 PAGES "1" RECORD "Detalhe" 0 1 0 TEST 0 3 AT 1;1;0 7 "" FIELD "Número_Fornecedor" C AT 1;1 SIZE 10;1 DEC 0 WID 10  PIC "" AS "" FIELD "Nome_Fornecedor" C AT 1;33 SIZE 58;1 DEC 0 WID 58  PIC "" AS "" FIELD "Data_Última_Atividade" D AT 1;277 SIZE 20;1 DEC 0 WID 20  PIC "DD/MM/AAAA" AS ""

Observações

Para obter mais informações sobre o funcionamento desse comando, consulte Definição e importação de arquivos de imagem de impressão (relatório) e arquivos PDF.

Resolução de problemas de importação de arquivos PDF na edição Unicode do Analytics

Se você encontrar problemas ao importar um arquivo PDF usando a edição Unicode do Analytics, o motivo poderá estar relacionado às especificações de tamanho:

  • Se caracteres de idioma estrangeiros aparecerem inesperadamente ou o layout da tabela do Analytics resultante estiver deslocado, verifique se o comprimento de SIZE é um número par.

    A especificação de um número de bytes ímpar para SIZE comprimento pode causar problemas no processamento subsequente dos dados importados.

  • Se a tabela do Analytics for criada, mas não tiver nenhum registro, experimente definir ignorar_comprimento com 2 ou outro número par se existirem dados de cabeçalho no início do arquivo que você quer ignorar.

Identificadores para os tipos de dados de campo

A tabela abaixo lista as letras que você deve usar ao especificar o tipo para FIELD. Cada letra corresponde a um tipo de dados do Analytics.

Por exemplo, se você estiver definindo um campo Sobrenome, que exige um tipo de dados de caractere, você especificaria "C": FIELD "Sobrenome" C.

Para obter mais informações, consulte Tipos de dados no Analytics.

Nota

Ao usar o Assistente de Definição de Dados para definir uma tabela que inclui campos EBCDIC, Unicode ou ASCII, os campos recebem automaticamente a letra “C” (para o tipo CARACTERE).

Ao inserir a instrução IMPORT manualmente ou editar uma instrução IMPORT, você pode substituir as letras mais específicas “E” ou “U” para os campos EBCDIC ou Unicode.

Letra

Tipo de dados do Analytics

A

ACL

B

BINARY

C

CHARACTER

D

DATETIME

E

EBCDIC

F

FLOAT

G

ACCPAC

I

IBMFLOAT

K

UNSIGNED

L

LOGICAL

N

PRINT

P

PACKED

Q

BASIC

R

MICRO

S

CUSTOM

T

PCASCII

U

UNICODE

V

VAXFLOAT

X

NUMERIC

Y

UNISYS

Z

ZONED