ການຮັບຮູ້ລັກສະນະຂອງ Optical Character Recognition (OCR) ແມ່ນຫຍັງ?

Optical Character Recognition (OCR) ຫມາຍເຖິງຊໍແວທີ່ສ້າງແບບດິຈິຕອນຂອງເອກະສານພິມ, ພິມຫຼື handwritten ທີ່ຄອມພິວເຕີສາມາດອ່ານໂດຍບໍ່ຈໍາເປັນຕ້ອງພິມດ້ວຍຕົນເອງຫຼືຂຽນຂໍ້ຄວາມ. OCR ໄດ້ຖືກນໍາໃຊ້ໂດຍທົ່ວໄປໃນເອກະສານສະແກນໃນຮູບແບບ PDF , ແຕ່ຍັງສາມາດສ້າງສະບັບພາສາທີ່ສາມາດອ່ານໄດ້ຈາກຄອມພິວເຕີ້ພາຍໃນໄຟລ໌ຮູບພາບ.

OCR ແມ່ນຫຍັງ?

OCR, ເຊິ່ງເອີ້ນວ່າການຮັບຮູ້ຂໍ້ຄວາມ, ແມ່ນເຕັກໂນໂລຢີຂອງຊອບແວທີ່ປ່ຽນແປງລັກສະນະຕ່າງໆເຊັ່ນຕົວເລກ, ຈົດຫມາຍ, ແລະຄໍາສັບຕ່າງໆ (ຍັງເອີ້ນວ່າ glyphs) ຈາກເອກະສານທີ່ພິມຫຼືຂຽນເປັນແບບເອເລັກໂຕຣນິກໄດ້ຮັບຮູ້ແລະອ່ານໂດຍຄອມພິວເຕີແລະຊອບແວອື່ນໆ. ບາງໂຄງການ OCR ເຮັດແບບນີ້ເປັນເອກະສານທີ່ຖືກສະແກນຫຼືຖ່າຍຮູບດ້ວຍກ້ອງຖ່າຍຮູບດິຈິຕອນແລະຄົນອື່ນສາມາດນໍາໃຊ້ຂະບວນການນີ້ກັບເອກະສານທີ່ໄດ້ຖືກສະແກນຫຼືຖ່າຍຮູບໂດຍບໍ່ມີ OCR ກ່ອນ. OCR ອະນຸຍາດໃຫ້ຜູ້ໃຊ້ສາມາດຄົ້ນຫາພາຍໃນເອກະສານ PDF, ແກ້ໄຂຂໍ້ຄວາມແລະສ້າງຮູບແບບໃຫມ່.

ແມ່ນຫຍັງ OCR ໃຊ້ສໍາລັບ?

ສໍາລັບຄວາມໄວ, ຄວາມຕ້ອງການການສະແກນທຸກໆມື້, OCR ອາດຈະບໍ່ເປັນເລື່ອງໃຫຍ່. ຖ້າທ່ານສາມາດຄົ້ນຫາໄດ້ໃນຂະຫນາດໃຫຍ່, ທ່ານສາມາດຄົ້ນຫາພາຍໃນໄຟລ໌ PDF ເພື່ອຊອກຫາທີ່ແນ່ນອນທ່ານຕ້ອງການຊ່ວຍປະຢັດເວລາແລະເຮັດໃຫ້ການເຮັດວຽກ OCR ໃນໂຄງການ scanner ຂອງທ່ານສໍາຄັນກວ່າ. ນີ້ແມ່ນບາງສິ່ງບາງຢ່າງອື່ນທີ່ OCR ຊ່ວຍກັບ:

ເປັນຫຍັງຈຶ່ງໃຊ້ OCR?

ເປັນຫຍັງຈຶ່ງບໍ່ພຽງແຕ່ເອົາຮູບ, ແມ່ນບໍ? ເນື່ອງຈາກວ່າທ່ານບໍ່ສາມາດແກ້ໄຂຫຍັງຫຼືຄົ້ນຫາຂໍ້ຄວາມເນື່ອງຈາກວ່າມັນຈະເປັນຮູບພາບ. ການສະແກນເອກະສານແລະການນໍາໃຊ້ຊອບແວ OCR ສາມາດເຮັດໃຫ້ໄຟລ໌ນັ້ນເປັນສິ່ງທີ່ທ່ານສາມາດແກ້ໄຂແລະສາມາດຄົ້ນຫາໄດ້.

ປະຫວັດຂອງ OCR

ໃນຂະນະທີ່ການນໍາໃຊ້ຂໍ້ມູນທໍາອິດຂອງການຮັບຮູ້ຂໍ້ມູນໃນປີ 1914, ການພັດທະນາຢ່າງກວ້າງຂວາງແລະການນໍາໃຊ້ເຕັກໂນໂລຢີທີ່ກ່ຽວຂ້ອງກັບ OCR ໄດ້ເລີ່ມຕົ້ນຢ່າງແທ້ຈິງໃນຊຸມປີ 1950, ໂດຍສະເພາະກັບການສ້າງແບບອັກສອນທີ່ງ່າຍດາຍຫຼາຍທີ່ງ່າຍຕໍ່ການແປງເປັນຂໍ້ຄວາມທີ່ສາມາດອ່ານໄດ້. ທໍາອິດຂອງຕົວອັກສອນທີ່ງ່າຍດາຍເຫຼົ່ານີ້ຖືກສ້າງຂື້ນໂດຍ David Shepard ແລະເປັນທີ່ຮູ້ຈັກທົ່ວໄປເປັນ OCR-7B. OCR-7B ຍັງໃຊ້ຢູ່ໃນອຸດສາຫະກໍາການເງິນສໍາລັບມາດຕະຖານທີ່ໃຊ້ໃນບັດເຄຣດິດແລະບັດເດບິດ. ໃນຊຸມປີ 1960, ບໍລິການໄປສະນີໃນຫຼາຍໆປະເທດໄດ້ເລີ່ມໃຊ້ເຕັກໂນໂລຢີ OCR ຢ່າງໄວວາເພື່ອເລັ່ງການຈັດຮຽງຈົດຫມາຍ, ລວມທັງສະຫະລັດ, ອັງກິດ, ການາດາແລະເຢຍລະມັນ. OCR ຍັງແມ່ນເຕັກໂນໂລຢີຫຼັກທີ່ໃຊ້ໃນການຄັດລອກອີເມວສໍາລັບບໍລິການໄປສະນີທົ່ວໂລກ. ໃນປີ 2000, ຄວາມຮູ້ທີ່ສໍາຄັນຂອງຂໍ້ຈໍາກັດແລະຄວາມສາມາດຂອງເຕັກໂນໂລຢີ OCR ໄດ້ຖືກນໍາໃຊ້ເພື່ອພັດທະນາ ໂຄງການ CAPTCHA ທີ່ ໃຊ້ເພື່ອຢຸດນັກໂຄສະນາແລະນັກຂີ້ເຫຍື້ອ.

ໃນຫລາຍທົດສະວັດ, OCR ໄດ້ພັດທະນາຄວາມຖືກຕ້ອງແລະມີຄວາມທັນສະໄຫມຫຼາຍຂຶ້ນຍ້ອນຄວາມກ້າວຫນ້າໃນຂົງເຂດເຕັກໂນໂລຢີທີ່ກ່ຽວຂ້ອງເຊັ່ນ: ຄວາມຮູ້ທາງປັນຍາ , ການຮຽນຮູ້ເຄື່ອງ ຄອມພິວເຕີແລະສາຍຕາຄອມພິວເຕີ. ໃນມື້ນີ້, ຊອບແວ OCR ໃຊ້ການຮັບຮູ້ຮູບແບບ, ການກວດສອບຄຸນນະສົມບັດແລະການຂຸດຄົ້ນຂໍ້ຄວາມເພື່ອຫັນປ່ຽນເອກະສານໄວແລະມີຄວາມຊັດເຈນກວ່າເກົ່າ.