Buscar formas de editar los HOCR generados por el Tesseract para la depuración de errores en el reconocimiento de caracteres.
Nota: Es posible generar txt en tesseract, pero el PDFBeads no los reconoce aunque tengan el mismo nombre que los tiff, a diferencia de la extensión hocr.