Skip to main content

PDF Reader

  • Task type: pdfreader

Il Task “PDF Reader” è uno strumento di estrazione dati specializzato nell'analisi di documenti in formato PDF. La sua funzione primaria è quella di processare un file PDF, verificarne la validità e estrarne l'intero contenuto testuale, rendendolo disponibile come parametro di output per i Task successivi.

Questo Task è fondamentale per automatizzare i processi che necessitano di leggere e interpretare informazioni contenute in documenti PDF, come fatture, report, contratti o qualsiasi altro documento testuale in questo formato.

Configurazione

La configurazione del Task è focalizzata sull'identificazione del file PDF da processare.

  • File da importare: In questo campo va inserito il percorso completo del file PDF di input. Il valore può essere fornito in due modi:
  1. Percorso Statico: Un percorso di file assoluto, digitato direttamente nel campo.
  2. Percorso Dinamico: Un riferimento a un parametro, proveniente da un Task precedente (come S-FTP In o E-Mail In) o da un parametro di input del Workflow. Ad esempio, si può utilizzare il parametro .file di un allegato email (#>E-Mail Out.file<#).

Processo di Esecuzione e Validazione

Durante la sua esecuzione, il Task segue un flusso strutturato di operazioni. In primo luogo verifica che il file indicato nel percorso esista e sia accessibile. Successivamente controlla che il file sia effettivamente un documento PDF, assicurandosi che il formato sia corretto prima di procedere con le operazioni successive.

Se entrambe le verifiche hanno esito positivo, il Task estrae il contenuto testuale del documento, pagina per pagina, consolidandolo in un unico output. Il testo estratto viene quindi reso disponibile attraverso i parametri di output del Task.

Qualora una qualsiasi di queste fasi dovesse fallire — ad esempio se il file non viene trovato, il formato non è valido o si verifica un errore durante la lettura — il Task passerà nello stato FAILED, e il parametro result conterrà un messaggio descrittivo dell’errore riscontrato.

Parametri di Output

Al termine dell'esecuzione, il Task espone i seguenti parametri di output:

  • text: Contiene l'intero contenuto testuale estratto dal documento PDF, formattato come una singola stringa di testo. Questo è il parametro principale da utilizzare nei Task successivi per operazioni di parsing o analisi.
  • result: Fornisce un messaggio testuale che descrive l'esito dell'operazione (es. "File PDF '[percorso]' verificato con successo" o un messaggio di errore specifico).
  • resultJson: Rappresenta il risultato dell’esecuzione del task in formato JSON, includendo informazioni generali, configurazioni e dettagli sull’esecuzione.

Esempio parametro resultJson

{
"id":19929,
"name":"PDF Reader",
"description":"",
"type":"pdfreader",
"type_name":"PDF Reader",
"type_description":"Estrae testo da file PDF",
"config":{
"file_path":"`#>test.file<#`",
"output_links":[
{
"to":"[TASK ...]",
"from":"[TASK ...]",
"text":"Condizione ...",
"color":"green",
"points":[
"..."
],
"toPort":"left...",
"fromPort":"port_...",
"isTraversed":true
}
]
},
"run_info":{
"run_id":1510212,
"start_datetime":"2026-04-28 ...",
"end_datetime":"2026-04-28 ...",
"start_epoch":1777380587...,
"end_epoch":1777380606...,
"duration":19,
"status":"Completed",
"cmd_text":"",
"run_result":"Success",
"result_text":"File PDF '/home/user_test/.../example.pdf' verificato con successo",
"full_result_text":"File PDF '/home/user_test/.../example.pdf' verificato con successo"
},
"output_parameters":{
"text":"<!-- image -->\n\nstudiare sviluppo\n\nVia ... Roma ...\n\n## Avviso per la costituzione ...\n\nLa Società ...\n\n## Finalità dell'avviso\n\nIl presente avviso ...\n\n- Cittadinanza ...\n- Godimento dei diritti ...\n- ...",
"exitStatus":"0"
}
}