Optisk tegngjenkjenning

Fra Wikipedia, den frie encyklopedi

Optisk tegngjenkjenning (engelsk: optical character recognition, OCR) er en teknikk for elektronisk eller maskinell oversettelse av trykte bokstaver eller håndskrift. OCR brukes blant annet for å konvertere trykte bøker og dokumenter til datafiler, og for elektronisk behandling av blanketter av ulike slag, som f.eks. giroer, sjekker, billetter, skjemaer osv.

OCR ble opprinnelig patentert av Gustav Tauschek i Tyskland i 1929, men først etter annen verdenskrig ble OCR virkelig utbredt. På 1960-tallet ble OCR tatt i bruk av postverkene i mange land både til behandling av postgiroer og sortering av brevpost.

Fri OCR-programvare[rediger | rediger kilde]

  • Tesseract (Linux, Windows, macOS)

Proprietær OCR-programvare[rediger | rediger kilde]