Apa itu Pengenalan Karakter Optik (OCR)?

Optical Character Recognition (OCR) mengacu pada perangkat lunak yang menciptakan versi digital dari dokumen yang dicetak, diketik, atau ditulis tangan yang dapat dibaca komputer tanpa perlu mengetik atau memasukkan teks secara manual. OCR umumnya digunakan pada dokumen yang dipindai dalam format PDF , tetapi juga dapat membuat versi teks yang dapat dibaca komputer dalam file gambar.

Apa itu OCR?

OCR, juga disebut sebagai pengenalan teks, adalah teknologi perangkat lunak yang mengubah karakter seperti angka, huruf, dan tanda baca (juga disebut glyphs) dari dokumen cetak atau tertulis menjadi bentuk elektronik yang lebih mudah dikenali dan dibaca oleh komputer dan program perangkat lunak lainnya. Beberapa program OCR melakukan ini sebagai dokumen yang dipindai atau difoto dengan kamera digital dan yang lain dapat menerapkan proses ini ke dokumen yang sebelumnya telah dipindai atau difoto tanpa OCR. OCR memungkinkan pengguna untuk mencari dalam dokumen PDF, mengedit teks, dan memformat ulang dokumen.

Apa itu OCR Digunakan Untuk?

Untuk cepat, setiap kebutuhan pemindaian setiap hari, OCR mungkin bukan masalah besar. Jika Anda melakukan pemindaian dalam jumlah besar, dapat mencari dalam PDF untuk menemukan yang tepat yang Anda butuhkan dapat menghemat cukup banyak waktu dan membuat fungsi OCR dalam program pemindai Anda lebih penting. Berikut beberapa hal lain yang dapat dibantu OCR:

Mengapa Menggunakan OCR?

Kenapa tidak berfoto saja, kan? Karena Anda tidak akan dapat mengedit apa pun atau mencari teks karena hanya berupa gambar. Memindai dokumen dan menjalankan perangkat lunak OCR dapat mengubah file itu menjadi sesuatu yang dapat diedit dan dapat dicari.

Sejarah OCR

Meskipun penggunaan paling awal dari tanggal pengenalan teks sampai tahun 1914, perkembangan dan penggunaan teknologi terkait OCR yang luas mulai dimulai pada tahun 1950-an, khususnya dengan penciptaan font yang sangat disederhanakan yang lebih mudah untuk dikonversi ke teks yang dapat dibaca secara digital. Yang pertama dari font yang disederhanakan ini dibuat oleh David Shepard dan umumnya dikenal sebagai OCR-7B. OCR-7B masih digunakan saat ini di industri keuangan untuk font standar yang digunakan pada kartu kredit dan kartu debit. Pada 1960-an, layanan pos di beberapa negara mulai menggunakan teknologi OCR untuk mempercepat penyortiran surat, termasuk Amerika Serikat, Inggris Raya, Kanada, dan Jerman. OCR masih merupakan teknologi inti yang digunakan untuk mengurutkan email untuk layanan pos di seluruh dunia. Pada tahun 2000, pengetahuan utama tentang batas dan kemampuan teknologi OCR digunakan untuk mengembangkan program CAPTCHA yang digunakan untuk menghentikan bot dan spammer.

Selama beberapa dekade, OCR telah tumbuh lebih akurat dan lebih canggih karena kemajuan di bidang teknologi terkait seperti kecerdasan buatan , pembelajaran mesin , dan visi komputer. Saat ini, perangkat lunak OCR menggunakan pengenalan pola, deteksi fitur, dan penambangan teks untuk mengubah dokumen lebih cepat dan lebih akurat daripada sebelumnya.