Sistema de reconocimiento óptico de caracteres [Optical Character Reader - OCR] que se utiliza para extraer texto de imágenes o documentos escaneados. Además de reconocimiento de texto, también realiza análisis de diseño, lo que significa que puede manejar documentos con múltiples columnas, tablas, y otros elementos de diseño. Es compatible con una gran variedad de idiomas: inglés [rmg], francés [fra], alemán [ger], italiano [ita], portugués [por], español [spa]...
$ cuneiform -o salida.txt documento.png
$ cuneiform -l spa -o salida.txt documento.png
$ cuneiform -v -f html -o salida.html documento.png