|

Basılı bir sayfa üzerindeki metinleri, tarayıcı ve OCR
yazılımıyla bilgisayarınıza aktarabilirsiniz.
Bazen, basılı bir sayfa üzerindeki metinleri bilgisayar ortamına
geçirmeniz gerekebilir. Ancak bu işlem için herşeyi baştan yazmak
zorunda değilsiniz. OCR programları, tüm metni kısa süre
içerisinde metin dosyası haline dönüştürebilirler.
OCR, "Optical Character Recognition" (optik karakter tanıma)
teriminin kısaltmasıdır ve basılı bir sayfa üzerindeki metnin,
klavye yardımıyla yazılmasına gerek kalmadan, kısa süre içerisinde
elektronik bir metin dosyası formatına çevrilmesi anlamına gelir.
Bir metnin OCR programı ile tanınması ve metin dosyası haline
dönüştürülmesi, doğal olarak baştan yazılmasından çok daha
kolaydır. En hızlı sekreter bile, dakikada maksimum 500 - 600
karakter yazabilir. Basılı bir metnin taranması ve elektronik
formatta yeniden düzenlenmesi için gerekli olan zaman ise, baştan
yazılmasına oranla en azından 40 kat daha kısadır. OCR teknolojisi
sadece düz metinler için değil; aynı zamanda rakamlar ve özel
semboller içeren tabloların dosya haline getirilmesi için de
kullanılabilir. OCR teknolojisinin sunduğu avantajlardan
yararlanmak istiyorsanız, öncelikle ortalama bir tarayıcıya ve
özel bir OCR programına ihtiyacınız olacak. Eğer tarayıcınızla
birlikte gelen CD'lere dikkatli bir biçimde göz atarsanız, bu
CD'lerin içerisinde bir OCR programının bulunduğunu
görebilirsiniz.
Ancak OCR yazılımlarını kullanabilmek için mutlaka bir tarayıcıya
sahip olmanıza da gerek yok. Eğer bilgisayarınızda bir metin
parçası içeren resim dosyaları varsa, bu dosyalar üzerindeki
metinleri de metin dosyası haline dönüştürebilirsiniz. Yani OCR
yazılımlarının görevi, aslında resim dosyalarındaki metinleri
metin dosyasına dönüştürmekten başka bir şey değildir. Tarayıcı
ise, basılı bir sayfanın resim dosyası olarak kaydedilmesi
görevini üstlenir.
OCR PROGRAMLARI NASIL ÇALIŞIR?
Peki ama OCR programları nasıl bir sistemle çalışıyorlar?
Tarayıcı, genellikle bilgisayarın "gözü" olarak tanımlanmaktadır;
kağıt üzerine basılı bir resmi okuyabilecek yeteneğe sahip bir
göz... Ancak bir metinden bahsedildiğinde, tarayıcı da bunu
yalnızca beyaz fon üzerinde siyah noktalar topluluğu olarak
algılar. Bu noktalar topluluğunu metne dönüştürmek ise OCR
programlarının görevidir.
Başka bir deyişle OCR programları, siyah piksel topluluğu olarak
temsil edilen harfleri "okuyabilecek" beceridedirler. Bir OCR
programı, her şeyden önce sayfayı satırlara böler ve her bir
kelimeyi diğerinden ayırarak sayfayı analiz eder. Analiz sırasında
harflerin yapısal karakterleri, yükseklikleri ve genişlikleri
değerlendirilir. Programın kendi bilgi deposu, her bir karakter
için tanımlanmış çeşitli parametrelerle doludur. Algılanan
pikseller bu parametrelerden birisine uygun ise, harfin ortaya
çıkması mümkün hale gelir.
OCR
programlarının son sürümleri, hemen her türlü karakteri
yakalayabilecek seviyededirler. Ancak bu noktada devreye, analiz
edilen resim dosyasının kalitesi girecektir. Metinleri içeren
resim dosyası çok kaliteli bir görüntü sunmayı başarabilirse,
ortaya çıkan metnin içerisindeki hatalar da büyük oranda azalır.
OCR PROGRAMLARI NASIL KULLANILIR?
OCR programlarını kullanmak, aslında son derece basittir;
dokümanın taranması ve algılanacak olan metinlerin
belirginleştirilmeleri yeterlidir. Diyelim ki metin içeren bir
sayfayı taradınız ve ortaya çıkan resim tam karşınızda duruyor.
Öncelikle resim içerisindeki metin alanlarını teker teker
seçmelisiniz. Program, seçtiğiniz tüm metin alanlarını belli bir
sıraya sokar ve algılama işlemini de bu sıraya göre düzenler.
Sizin yapmanız gerekense, sadece algılama işlemini başlatacak olan
düğmeye basmak ya da gerekli komutu vermektir. Metinler, kısa süre
içerisinde ekrana geleceklerdir. Bundan sonra, algılanan metinler
için bir dosya formatı seçebilir ve kayıt aşamasını
tamamlayabilirsiniz.
OCR
PROGRAMINI SEÇERKEN...
Internet üzerinde satışa sunulan çok sayıda farklı OCR programı
bulmanız mümkün. Her şeyden önce, metin algılama işlemini hangi
amaçla yapacağınıza karar vermelisiniz. Eğer profesyonel bir
amacınız yoksa, uygun fiyatlı basit programlara yönelebilirsiniz.
Fine Reader gibi kapsamlı ve nispeten daha yüksek bir fiyat
karşılığında sunulan programlar ise, profesyonel amaçlar için bile
yeterli performansı sunmaktadırlar. Bu tip bir program ile hem
hataları minimum düzeye indirebilir, hem de metinleri imla
hatalarına karşı koruyabilirsiniz. Çünkü gelişmiş OCR programları
sadece metinleri algılamakla kalmazlar; aynı zamanda algılanan
metni denetlerler.
OCR PROGRAMLARI ÖĞRENEBİLİRLER
OCR programlarının hemen hepsi "öğrenmeye" açıktırlar. Örneğin
yeni bir harf tipini programa ezberletmeniz ve bu harf tipi ile
hazırlanan bir metni metin dosyası haline getirmeniz mümkündür.
OCR programlarına sadece yeni harfleri değil, özel sembol ve
işaretleri öğretme şansına da sahipsiniz. Basılı dokümanlarda
bulunan özel karakterler de (matematik sembolleri veya deforme
harfler gibi), kolaylıkla programın "bilgi deposu"na
eklenebilirler.
OCR teknolojisinin gelecekte ulaşacağı noktayı şimdiden kestirmek
oldukça zor. Kesin olan tek şey ise, bu teknolojinin en azından
önümüzdeki on yıl boyunca yoğun olarak kullanılacağı. Başka bir
deyişle kağıtlar ve basılı dokümanlar var oldukça, OCR teknolojisi
de ağırlığını hissettirecek. Ayrıca OCR programlarının sunduğu
özelliklerin daha da artacağından ve hata oranının sıfıra kadar
düşeceğinden kimsenin şüphesi olmamalı.
OCR
PROGRAMLARINI NEREDE BULACAĞIZ?
Yazı İçerisinde de belirttiğimiz gibi. OCR programları genellikle
tarayıcı İle birlikte kullanıcılara sunulmaktadır. Ancak siz
farklı bir program kullanmak İstiyor da olabilirsiniz. Bu durumda
İnternette küçük bir arama yapmalı, ücretli ya da ücretsiz
programlardan dilediğinizi seçmelisiniz. En İyi OCR
programlarından biri, hiç kuşkusuz Fine Reader'dır. Fine Reader,
çok düşük kalitedeki kağıtların üzerinde yer alan metinleri bile
yüksek doğruluk oranı İle tanıyabilir, örneğin bir gazete
sayfasındaki metinleri taramaya kalkıştığınızda, çoğu zaman
hatalarla karşılaşırsınız. Ancak Fine Reader, bu sorunları minimum
seviyeye İndirmeyi başarmıştır. Ayrıca program İle "yakalanan"
metinler, birçok farklı dosya formatında ("TXT", "DOC" ya da "PDF"
gibi) kaydedilebilir.
NASIL BİR TARAYICI?
Piyasada çok farklı marka ve modellerde sayısız tarayıcı bulmanız
mümkün. Uygun fiyat karşılığında satın alacağınız bir tarayıcı
bile, OCR programlarının metinleri algılamasını sağlayacak yeterli
performansı sunmaktadırlar. Ancak OCR teknolojisini profesyonel
düzeyde kullanmak gibi bir niyetiniz varsa, bu durumda yüksek
çözünürlükte tarama yapabilen ve daha pahalı olan üst düzey bir
tarayıcıyı tercih etmeniz gerekli.
|