Convertir/Exportar/Leer de PDF a

Hola Foro (felices fiestas)

Tengo la necesidad de obtener unos datos de un archivo en formato PDF, sabeis alguna forma o herramienta para poder leer/exportar, por ejemplo leer/exportar el citado PDF y pasar los datos a CSV o json para que posteriormente poderlo leer.

¿O si teneis alguna idea de como puedo obtener esos datos de esos PDF?

Saludos
Ramon Denuc

Hola Ramon.

Echa un vistazo a Glyph & Cog: XpdfText.

Convierte un PDF a texto por línea de comandos

pdftotext.exe -enc UTF-8 -raw <archivo.pdf>

Saludos
Paco Satué

Hola Paco,

Gracias Paco , mientras tanto yo también estuve buscando y encontre otro programa para extraer textos que soporta los siguientes ficheros: AZW, AZW3, CHM, DjVu, DOC, DOCX, EML, EPUB, FB2, FB3, HTML, LIT, MD, MHT, MOBI, ODP, ODS, ODT, PDB, PDF, PPT, PPTX, PRC, RTF, TCR, TXT, WPD, WRI, XLS, XLSX.

La aplicación no tiene interfaz gráfica y se ejecuta en modo linea de comandos.

Lo he estado probando, y funciona exactamente como yo deseaba, pues al extraer el texto del documento PDF deja los datos en un archivo TXT que solo tengo que parsear y obtener el texto deseado.

Aquí os dejo el enlace: http://www.cross-plus-a.com/es/btext.htm

:christmas_tree: Feliz Navidad a todos. :christmas_tree:

Saludos
Ramon Denuc