Programari d'imatges de documents JOCR

JOCR és un programari especialitzat en reconeixement òptic de caràcters (ocr) que pot reconèixer caràcters a partir d’imatges preses a l’escriptori de l’ordinador.

Abans d’aprofundir en la funcionalitat, cal tenir en compte que JOCR requereix el component d’imatge de documents de Microsoft Office que és un component de Microsoft Office 2003 i versions més recents d’Office. L’eina d’Office s’ha d’instal·lar perquè JOCR funcioni del tot.

El propi JOCR és un programa de programari portàtil. La interfície sembla la d'una pantalla de captura de programes de programari. Ofereix capturar una regió, l'escriptori o la finestra activa. La imatge es mostra a la interfície del programa amb opcions per imprimir-la o copiar-la o per reconèixer-la que inicia el procés OCR.

OCR amb JOCR

document imaging software

El reconeixement és, òbviament, la part principal, ja que analitzarà la imatge disponible per descobrir tots els personatges que conté. El programari d'imatges de documents mostra el recompte de caràcters identificat i els mostra a l'editor de text per defecte des d'on es poden editar o copiar fàcilment.

El programari d'imatges de documents pot ser útil en situacions en què el text s'ha de copiar dels elements de la interfície. Es poden tractar de missatges d’error, text que es mostra en aplicacions o imatges. La taxa de reconeixement depèn en gran mesura del tipus d’imatge i text utilitzat. Va des de brillant (gairebé no cal fer cap edició) fins a feble (no han pogut reconèixer certs caràcters, cal fer molta edició).

JOCR és compatible amb els idiomes següents: xinès, txec, danès, holandès, anglès, finès, francès, alemany, grec, hongarès, italià, japonès, coreà, noruec, polonès, portuguès, rus, espanyol, suec, turc.

Veredicte

JOCR és un programa ben dissenyat que podeu utilitzar per convertir text en qualsevol imatge o programa que veieu a la màquina Windows.

Nota : Jocr no s'ha actualitzat des del 2006, cosa que fa que no funcioni en versions més noves de Windows o Office. Una solució comparable és GOCR , un programari de reconeixement de caràcters de codi obert que podeu descarregar de la pàgina Sourceforge del projecte.

El programa està disponible per a Linux i Windows, i com a codi font. Heu de carregar imatges al programa de manera que el contingut textual de les imatges es pugui convertir en text normal que podeu copiar. Tot i que no admet la funcionalitat de captura de pantalla, és prou fàcil crear una captura de pantalla tu mateix, guardar-la com a fitxer d’imatges i carregar-la al programa perquè es reconegui el text.