Hoe werkt OCR? Op een eenvoudige en begrijpelijke manier uitgelegd
In dit artikel leggen we uit hoe OCR werkt. OCR staat voor "Optical Character Recognition" en wordt in het Duits eenvoudigweg tekstherkenning genoemd. Dit betekent dat een computer tekst op een gescande afbeelding kan herkennen met behulp van OCR en deze vervolgens kan omzetten in een eenvoudig tekstdocument.
Dit is hoe OCR werkt
Stel je voor dat je een papieren presentatie van een collega hebt ontvangen. U wilt deze nu op de pc bewerken omdat u niet van individuele passages houdt. Dus scan het en ga naar uw OCR-programma. Nu gebeurt het volgende:
- De software voert eerst een zogenaamde lay-outanalyse uit. Om dit te doen, kijkt ze naar de paginalay-out en scheidt afbeeldingen van tekst. Ze noteert ook hun positie op de pagina. Vervolgens wordt het aantal alinea's geteld en worden afzonderlijke elementen zoals paginanummers opgeslagen.
- Nu komt het moeilijke gedeelte. De software kijkt naar de afzonderlijke tekstblokken en verdeelt deze in zinnen. De zinnen worden vervolgens opgesplitst in afzonderlijke woorden en de woorden in letters.
- De OCR-software bevat patronen van letters en tekens. Het programma vergelijkt nu de gescande letters met deze patronen. Als ze 99% vergelijkbaar zijn, besluit het algoritme dat het waarschijnlijk die letter moet zijn. Het is heel precies omdat het veel patronen in korte tijd kan vergelijken. Op deze manier maakt hij met succes onderscheid tussen een "8" en een "B".
- De letters en tekens worden dus geleidelijk herkend. Vervolgens worden ze weer als woorden gecombineerd en op hun plaats in de zin teruggezet. Zodra de software is voltooid, wordt het hele ding opgeslagen in een normaal document, dat u vervolgens kunt bewerken. Klaar!
Wilt u uw software-kennis testen? Doe mee aan onze grote softwarequiz!