Optické rozpoznávání znaků

technologie převodu dokumentu z digitální obrazové do textové podoby pomocí metody optického rozpoznávaní znaků

Optické rozpoznávání znaků či OCR (z anglického Optical Character Recognition) je metoda, která pomocí scanneru umožňuje digitalizaci tištěných textů, s nimiž pak lze pracovat jako s normálním počítačovým textem. Počítačový program převádí obraz buď automaticky, nebo se musí naučit rozpoznávat znaky. Převedený text je téměř vždy v závislosti na kvalitě předlohy třeba podrobit důkladné korektuře, protože OCR program nemusí rozeznat všechna písmena správně. OCR – zpracování textu z tištěné do elektronické podoby je použitelné pro všechny tištěné výstupy z laserových, inkoustových, termosublimačních a jehličkových tiskáren a samozřejmě pro předlohy vytištěné knihtiskem. U nevhodných předloh, např. slabě vytištěných jehličkových výtisků nebo dohromady slitých písmen, se z časového hlediska vyplatí spíše přepis textu.

Pro snadné rozpoznávání znaků byly vyvinuty strojově čitelné fonty, např. OCR-A, nebo dnes používanější OCR-B.

OCR softwareEditovat

Jméno Licence Operační systém Poznámky
ABBYY FineReader OCR Komerční Microsoft Windows Vista, Microsoft Windows Server 2003, Windows XP, Windows 2000 (SP2)..
Adobe Acrobat Komerční Windows, Mac OS X
PDF-XChange Viewer Freeware Windows
PDF-XChange Viewer Pro Komerční Windows
GOCR GPL (open source)
Microsoft Office Document Imaging Komerční Windows, Mac OS X
NovoDynamics VERUS Komerční? ?
Ocrad GPL Unix-like, OS/2
OCRopus Apache Linux
OmniPage Komerční (Nuance EULA) Windows Produkt Nuance Communications
Readiris Komerční Windows, Mac OS Produkt I.R.I.S.
ReadSoft Komerční ?
SimpleOCR Freeware a komerční Windows
SmartScore Komerční Windows, Mac
Tesseract Apache Windows, Mac OS X, Linux, OS/2 Vyvíjeno Googlem
Nicomsoft OCR Komerční Windows, Linux

Externí odkazyEditovat