Optik karakter tanıma teknolojisi, İngilizcesi "optical character recognition"
olup, genellikle teknik metinlerde OCR kısaltmasıyla kullanılır. Teknoloji,
pratikte el ile yazılmış, daktilo ile yazılmış veya bilgisayar çıktısı olan
metinlerin, tarayıcılar yardımıyla taranıp, dijital ortama aktarılmasına
dayanır.
OCR teknolojisinin tarihçesi, eski zamanlara, 1914'lere varır.
Öyle ki, Emanuel Goldberg, harfleri tanıyıp onları standart telgraf kodlarına
dönüştüren bir makine tasarlamıştır. Aynı zamanlarda, Edmund Fournier d'Albe de
bir "optofon" tasarlamıştır. Optofon, bir sayfanın üzerinde
dolaştırdığınızda önceden tanımladığınız harfleri veya harf dizilerini gördüğü
zaman sizi uyaran bir araçtır. Daha sonra ilkel OCR teknolojileri, şablon
eşleştirme sistemleri olarak kullanılmıştır. 1949 yılında, Amerika'da ilk
"yazıdan sese" teknolojisi geliştirilmiştir. Aslında bu da OCR
teknolojisinin geri çevrilmiş bir uygulamasıdır. 1950 yılında David H. Shepard
adlı bir şifreleme uzmanı, İngiliz alfabesinin 23 harfini, mors kodlarını,
müzik notalarını tanımlayabilen ve basılı sayfaları sesli olarak okuyabilen bir
cihaz geliÅŸtirmiÅŸtir. Shepard daha sonra Intelligent Machines Research
Corporation adlı OCR teknolojisi şirketini kurmuştur. Bu şirket, ilk ticari OCR
sistemlerini üreten şirket olmuştur.
Shepard’ın sistemleri IBM gibi büyük şirketler tarafından lisanslanmış
ve ticaret alanında büyük rağbet görmüştür. Amerikan Posta Servisi kurumu da bu
teknolojiyi kullanan kurumlardan biridir.
OCR teknolojisi, körlerin de imdadına koşmuştur. Ray Kurzweil tarafından
1974’te kurulan Kurzweil Bilgisayar Ürünleri şirketi, körler için bir sistem
geliştirdi. Sistem, günümüzde kullanılan tipte bir tarayıcıdan ve yazıyı sese
dönüştürme teknolojisinden ibaretti. Bu sistem körlere büyük kolaylıklar
sağlamaktaydı. Sistem daha sonra büyük makale veritabanına sahip LexisNexis
şirketi tarafından kullanılmıştır. 2 yıl sonra da Kurzweil şirketini Xerox’a
satmıştır. Şirket şu an Nuance İletişim Teknolojileri şirketinin elinde
bulunmaktadır.
OCR Yazılımları
Günümüzde OCR teknolojisi cebimize kadar girmiş bulunmakta. Öyle ki
akıllı telefonlarda bulunan bazı programlar, fotoğrafını çektiğiniz belgeleri
otomatik olarak dijital ortama aktarıp, PDF gibi yaygın formatlara
dönüştürebiliyorlar.
OCR yazılımları, tarayıcı üzerinden taradığınız bir sayfadaki karakterleri, kendinde önceden tanımlanmış olarak karakter tablolarındaki karakterlerle karşılaştırıp, taradığı karaktere en çok benzeyen karakteri seçer. Seçtiği karakterleri, taradığı formata uygun biçimde yerleştirir. Bu sayede taradığınız metin, dijital ortama aktarılmış olur.
WebOCR & ÇevrimiçiOCR diye anılan hizmetler de günümüzde yaygındır. Bu sistemlerde taradığınız belgeleri yükleyip, çevrimiçi sunucularda karakter tanıma işlemi gerçekleştirip, sonucu size aktarırlar.
Ayrıca bazı sistemlere üye olurken gördüğünüz CAPTCHA teknolojisi de, OCR teknolojisinin bir ürünüdür. O minik resimlerdeki karakterler OCR teknolojisi ile okunamamakta, bu sayede işlemi gerçekleştiren kişinin insan olduğundan emin olunmaktadır.