Guía de uso de Tesseract OCR

Alcaraz Martínez, Rubén2026-02-132026-02-132026-02-12https://hdl.handle.net/2445/226842Se presenta Tesseract como motor de reconocimiento óptico de caracteres (OCR) para Windows y sistemas basados en Linux. Se explica el proceso de instalación y configuración inicial en Windows mediante binarios, la configuración de variables de entorno (PATH) y de la ruta de datos de idiomas, la verificación de la instalación y la incorporación de archivos de idioma adicionales. Finalmente, se muestran los principales comandos de la herramienta para generar resultados en texto plano, así como para producir salidas en formatos PDF con texto incrustado, ALTO-XML, hOCR y TSV.9 p.application/pdfspacc by-nc-sa (c) Alcaraz Martínez, Rubén, 2026http://creativecommons.org/licenses/by-nc-sa/4.0/Processament de dadesReconeixement òptic de caràctersGuía de uso de Tesseract OCRinfo:eu-repo/semantics/otherinfo:eu-repo/semantics/openAccess