- Úvod >
- Rady a podpora >
- Legislatíva >
- Čitateľné PDF
Čitateľné PDF podľa prístupnosti
OCR (Optical Character Recognition) je technológia, ktorá prevádza obrazový text (napr. zo skenu, fotografie alebo PDF) do strojovo čitateľnej a editovateľnej textovej podoby.
Laicky povedané - je to pdf, kde text dokážete označiť myšou.
VtedyTento text vie prečítať aj čítačka pre slabozrakých a nevidiacich. Viac o prístupných štruktúrach dokumentu v tomto článku:
https://www.theseus.cz/pristupna-struktura-dokumentu-a-webu-format-pdf/
PDF s OCR na webe
Weby, ktoré majú podľa legislatívy spĺňať prístupnosť musia uverejňovaťPDF dokumenty s OCR vrstvou.Stačí, keď vložia obrázok PDF a pod ním dajú na stiahnutie PDF s OCR vrstvou.

1. PDF s vrstvou OCR je možné spraviť z viacerých typov dokumentov a súborov :
- Papierový leták - do PDF sa dostane zoskenovaním
pri scanovaní treba vybrať možnosť čitateľná vrstva alebo OCR
- Dokument je v elektronickej podobe napr. vo worde
dá sa uložiť ako PDF, vtedy je čitateľný vždy, netreba nič robiť
- Dokument je v elektronickej podobe ako obrázok .png , .jpg alebo klasické PDF
klasickým uložením jpg ako PDF nie je dokument čitateľný s OCR vrstvou
treba ho konvertovať cez PDF konvertor
2. Konvertovanie obrázka s textom do PDF s OCR vrstvou
Je potrebné použiť nástroj na konvertovanie. Je ich viac k dispozícii - platené aj neplatené verzie.
Ako free nástroj je možné použiť napríklad PDF24 - https://tools.pdf24.org/sk/
Konvertovanie v 1 alebo 2 krokoch:
ak je obrázok vo formáte jpg/png treba ho dať do klasického formátu pdf
ak je už obrázok vo formáte PDF - robí sa len 2.krok
1. krok - z JPG /PNG do PDF
na to sa dá použiť nástroj PDF24 časť Obrázky do PDF - https://tools.pdf24.org/sk/obrazky-do-pdf

2. krok - PDF na PDF OCR
z klasického PDF sa dá konvertovať na PDF s OCR v časti PDF OCR https://tools.pdf24.org/sk/ocr-pdf
Po vložení súboru treba ešte zvoliť jazyk.
Konvertovanie je časovo náročné. Pri rozsiahlych súboroch, ako sú niekoľkostranové letáky a pod. odporúčame použiť iný nástroj

Voľba jazyka

Potom treba počkať na konvertovanie

