|
|---|
De texto en papel a procesador de textos.
Considero que ni siquiera es una idea, sino algo muy elemental, pero ya que se dan preguntas de este tipo, lo incluyo.
Tan sólo se precisan dos herramientas: un escaner (que se apoyará en un controlador Twain) y un
software que se denomina OCR (reconocimiento óptico de caracteres).
Sólo unos consejos. Al reproducir la imagen en el escaner, no es positivo en general que la resolución
sea excesivamente alta (si es que el componente las permite) pues el software tratará de reconocer todo,
incluidas las imperfecciones del original, es importante conseguir según el estado y el tipo de documento
una resolución idónea.
Una vez que se ha transformado en fichero gráfico, bien a través del software de captura que proporciona
el fabricante, bien por la opción correspondiente del propio OCE, éste lo que va a hacer va a ser
comparar "lo que sabe con lo que ve", considerando como separación los espacios. De forma que
un texto a máquina u ordenador, absolutamente nítido, con una separación perfecta entre caracteres,
no le debe de ofrecer ninguna dificultad, pero ¡misterio! es el caso menos frecuente. Si no fuese así,
generalmente los escaner llevan incorporados un disco que entre sus controladores y demás, contiene distintos
software de este tipo, sería suficiente para situaciones idóneas, en caso contrario el resultado
puede ser lamentable, sin contar con que el original esté escrito a mano.
Para todos estos casos recomendaría los OCR "inteligentes", es decir, que cada signo que no conocen
lo van a preguntar. Cuando el documento es complicado, la cantidad puede ser tal que desborde la capacidad del
propio programa, sin contar la dificultad y tiempo que conlleva "enseñar a leer", en mi opinión
es mucho mayor que el necesario en los programas de reconocimiento de voz. No obstante se consigue, lo cual no
es posible con los "no inteligentes" que son los que por norma general vienen incorporados al escaner,
habida cuenta de que el precio de un buen OCR es relativamente alto.
Opino que tan sólo hay en el mercado dos o tres productos de este tipo que valen la pena. No es mi intención
hacer propaganda y no la hago, pero como ocurre frecuentemente, son los de precio más elevado.
José Luis Freire
El Rinconcito Informático: 25/06/2000 - (c) 2000 - 2008 | Creación y mantenimiento : José Luis Freire | Se pretende poder utilizar cualquier navegador. Recomendado 1024x768 |