miércoles, 26 de noviembre de 2014

pdf OCR




Bien, pues contábamos con una especie de "impresora multifunción" con la cual escaneábamos documentos y automáticamente los pasaba a pdf pero no contábamos con nada de reconocimiento OCR para poder reconocer las palabras del pdf y poder modificarlas, las reconocía como si fuesen imágenes.

Bueno pues buscando por ahí, en linux y windows


Probé:
   webs:
http://docs.google.com
http://free-online-ocr.com/
http://www.free-ocr.com/
http://www.onlineocr.net
http://www.newocr.com/

   Aplicaciones:
OCRFeeder (leí que el motor de OCR que utiliza no es muy malo "Tesseract") en ubuntu 12.04
Softi FreeOCR en Windows.
 Entre otros.....

Pero, el único programa que me encanto en comparación con todos los que hice pruebas para mi fue:
Wondershare PDF Converter Pro 3.0.0.9  (Windows)

Aunque lo exporté a excel, documentos de word y no a "pdf buscable" que es lo que queríamos:
Pero aún así es mucho mas rápido que los demás, la pega es que es de pago!!.

Bueno pues al final conseguí dar con la herramienta perfecta para convertir los "pdf imagen"  a "pdf buscables":
 Adobe Acrobat XI PRO  (Windows)
    (podréis probarlo con la versión de prueba que nos dejan, es una pasada)

Un saludo y si saben de alguna aplicación de la plataforma que fuese mejor "MEJOR" a estos, os lo agradecería.

0 comentarios:

Publicar un comentario