Optik belgilarni aniqlash (OCR) nima?

Mundarija:

Optik belgilarni aniqlash (OCR) nima?
Optik belgilarni aniqlash (OCR) nima?
Anonim

Xarakterlarni optik aniqlash (OCR) matnni qoʻlda terish yoki kiritish zaruratisiz kompyuterlar oʻqishi mumkin boʻlgan bosma, terilgan yoki qoʻlda yozilgan hujjatning raqamli versiyasini yaratuvchi dasturiy taʼminotga ishora qiladi. OCR odatda PDF formatidagi skanerlangan hujjatlarda qoʻllaniladi, biroq tasvir faylida matnning kompyuter oʻqiy oladigan versiyasini ham yaratishi mumkin.

OCR nima

OCR, shuningdek, matnni aniqlash deb ham ataladi, bu bosma yoki yozma hujjatlardagi raqamlar, harflar va tinish belgilari (shuningdek, gliflar deb ataladi) kabi belgilarni kompyuterlar tomonidan osonroq taniladigan va oʻqiladigan elektron shaklga oʻzgartiruvchi dasturiy texnologiya. boshqa dasturiy ta'minot dasturlari. Ba'zi OCR dasturlari buni hujjat raqamli kamera bilan skanerlash yoki suratga olishda amalga oshiradi, boshqalari esa bu jarayonni avval OCRsiz skanerlangan yoki suratga olingan hujjatlarga qo'llashi mumkin. OCR foydalanuvchilarga PDF hujjatlari ichida qidirish, matnni tahrirlash va hujjatlarni qayta formatlash imkonini beradi.

Image
Image
Tarixiy gazeta OCR dasturi bilan skanerlanmoqda.

Getty Images

OCR nima uchun ishlatiladi?

Tez, kundalik skanerlash ehtiyojlari uchun OCR unchalik katta muammo boʻlmasligi mumkin. Agar siz katta hajmdagi skanerlashni amalga oshirsangiz, PDF-fayllar ichidan keraklisini topish uchun qidirib topishingiz vaqtni ancha tejaydi va brauzer dasturingizdagi OCR funksiyasini muhimroq qiladi. OCR yordam beradigan boshqa ba'zi narsalar:

  • Avtomatlashtirilgan ma'lumotlarni qayta ishlash va ma'lumotlarni kiritish (Misol: Ishga da'vogarning rezyumelarni kuzatish tizimlari).
  • Skanlangan kitoblarni qidirish mumkin.
  • Qoʻlda yozilgan skanerlarni kompyuterda oʻqiladigan matnga aylantirish.
  • Koʻzi ojiz foydalanuvchilarga yordam beruvchi oʻquvchi dasturlari hujjatlarni yanada qulayroq qilish.
  • Tarixiy hujjatlar va gazetalarni saqlash, shu bilan birga ularni qidirish mumkin.
  • Ma'lumotlarni olish va buxg alteriya dasturlariga o'tkazish (Masalan: Kvitansiyalar va invoyslar).
  • Qidiruv tizimlarida foydalanish uchun hujjatlarni indekslash.
  • Tezlik kamerasi va qizil chiroq kamerasi dasturiy ta'minoti orqali haydovchi raqamlarini tanib olish.
  • Gapira olmaydiganlar uchun nutq sintezatorlari - nazariy fizik Stiven Xoking, ehtimol nutq sintezatori dasturining eng taniqli foydalanuvchisidir.

Quyi chiziq

Nega shunchaki rasmga tushmaysiz, to'g'rimi? Chunki siz hech narsani tahrirlay olmaysiz yoki matnni qidira olmaysiz, chunki u shunchaki rasm bo'lar edi. Hujjatni skanerlash va OCR dasturini ishga tushirish bu faylni tahrirlash va qidirishingiz mumkin bo'lgan narsaga aylantirishi mumkin.

OCR tarixi

Matnni tanib olishning eng erta qoʻllanilishi 1914-yilga toʻgʻri kelgan boʻlsa-da, OCR bilan bogʻliq texnologiyalarning keng miqyosda rivojlanishi va qoʻllanilishi 1950-yillarda, xususan, raqamli formatga oʻtkazish osonroq boʻlgan juda soddalashtirilgan shriftlarning yaratilishi bilan boshlangan. o'qilishi mumkin bo'lgan matn. Ushbu soddalashtirilgan shriftlarning birinchisi Devid Shepard tomonidan yaratilgan va odatda OCR-7B nomi bilan tanilgan. OCR-7B bugungi kunda ham kredit va debet kartalarida ishlatiladigan standart shrift uchun moliya sanoatida qo'llaniladi. 1960-yillarda bir qancha mamlakatlarda pochta xizmatlari OCR texnologiyasidan pochtani saralashni sezilarli darajada tezlashtirish uchun foydalanishni boshladi, jumladan AQSh, Buyuk Britaniya, Kanada va Germaniya. OCR hali ham butun dunyo bo'ylab pochta xizmatlari uchun pochtani saralash uchun ishlatiladigan asosiy texnologiyadir. 2000-yilda OCR texnologiyasining chegaralari va imkoniyatlari haqidagi asosiy bilimlardan botlar va spamerlarni toʻxtatish uchun ishlatiladigan CAPTCHA dasturlarini ishlab chiqishda foydalanilgan.

Oʻnlab yillar davomida sunʼiy intellekt, mashinani oʻrganish va kompyuterni koʻrish kabi tegishli texnologiya sohalaridagi yutuqlar tufayli OCR yanada aniqroq va murakkabroq boʻldi. Bugungi kunda OCR dasturi hujjatlarni har qachongidan ham tezroq va aniqroq aylantirish uchun naqshni aniqlash, xususiyatlarni aniqlash va matnni qazib olishdan foydalanadi.

FAQ

    Hujjatlarni telefon yoki planshet bilan qanday skanerlashim mumkin?

    IOS-da Notes ilovasini oching va yangi qayd yarating. Kamerani oching va Hujjatlarni skanerlash-ga teging. Android qurilmasida Google Drive-ni oching va Plus (+) ni tanlang, soʻng skanerlash uchun Scan ni bosing. telefoningiz bilan hujjat.

    Adobe Acrobat'da OCRdan qanday foydalanaman?

    Skanlangan tasvirni oʻz ichiga olgan PDF faylni oching, soʻng Tools > PDF tahrirlash ni tanlang. Matnni tahrirlashingiz uchun Acrobat avtomatik ravishda OCR ni qo'llaydi. Faqat tahrir qilmoqchi boʻlgan joyni tanlang va yozishni boshlang.

    OCR va OMR oʻrtasidagi farq nima?

    Optik belgilarni aniqlash (OMR) - qog'ozdagi belgilarni, odatda pufak varaqlarini aniqlaydigan dastur. OMR imtihonlar, so'rovlar, anketalar va hatto saylovlar natijalarini qayta ishlash uchun ishlatiladi. OCR dan farqli o'laroq, OMR sahifadagi belgilarni shifrlay olmaydi, faqat belgilar mavjudligini tasdiqlaydi.

Tavsiya: