ແມ່ນຫຍັງທີ່ແທ້ຈິງແມ່ນ 'ຂໍ້ມູນໃຫຍ່'?

ແລະເປັນຫຍັງມັນເປັນເລື່ອງໃຫຍ່?

'ຂໍ້ມູນໃຫຍ່' ແມ່ນວິທະຍາສາດໃຫມ່ຂອງການເຂົ້າໃຈແລະຄາດຄະເນພຶດຕິກໍາຂອງມະນຸດໂດຍການສຶກສາປະລິມານຂະຫນາດໃຫຍ່ຂອງຂໍ້ມູນທີ່ບໍ່ມີໂຄງສ້າງ. ຂໍ້ມູນໃຫຍ່ແມ່ນເປັນການວິເຄາະການຄາດຄະເນ.

ການວິເຄາະ Twitter ບົດຄວາມ, ເຟສບຸກຟີດະ, ການຄົ້ນຫາ eBay, ບົບຕິດຕາມລຸດ GPS ແລະເຄື່ອງ ATM ແມ່ນບາງຕົວຢ່າງຂໍ້ມູນທີ່ສໍາຄັນ. ການສຶກສາວິດີໂອຄວາມປອດໄພ, ຂໍ້ມູນການຈະລາຈອນ, ຮູບແບບສະພາບອາກາດ, ການມາຮອດທ່ຽວບິນ, ບັນທຶກຫໍຄອຍໂທລະສັບມືຖືແລະບົບຕິດຕາມຄວາມໄວຂອງຫົວໃຈແມ່ນຮູບແບບອື່ນໆ. ຂໍ້ມູນໃຫຍ່ແມ່ນວິທະຍາສາດໃຫມ່ທີ່ສັບສົນທີ່ປ່ຽນແປງທຸກໆອາທິດ, ແລະຜູ້ຊ່ຽວຊານນ້ອຍໆເຂົ້າໃຈມັນທັງຫມົດ.

ບາງຕົວຢ່າງຂອງຂໍ້ມູນໃຫຍ່ໃນຊີວິດແບບປົກກະຕິແມ່ນຫຍັງ?

screenshot http://project.wnyc.org/transit-time

ໃນຂະນະທີ່ໂຄງການຂໍ້ມູນຂະຫນາດໃຫຍ່ທີ່ສຸດແມ່ນບໍ່ຄ່ອຍຈະແຈ້ງ, ມີຕົວຢ່າງທີ່ສໍາຄັນຂອງຂໍ້ມູນທີ່ມີຄວາມສໍາຄັນຕໍ່ຊີວິດປະຈໍາວັນຂອງບຸກຄົນ, ບໍລິສັດແລະລັດຖະບານ:

ການຄາດຄະເນການລະບາດຂອງເຊື້ອໄວຣັສ: ໂດຍການສຶກສາຂໍ້ມູນດ້ານການເມືອງ, ຂໍ້ມູນທາງອາກາດແລະສະພາບອາກາດແລະຂໍ້ມູນທາງໂຮງພະຢາບານ, ນັກວິທະຍາສາດເຫຼົ່ານີ້ກໍາລັງຄາດຄະເນການລະບາດຂອງໄຂ້ເລືອດອອກດ້ວຍການແຈ້ງເຕືອນລ່ວງຫນ້າ 4 ອາທິດ.

ໂມງການຂ້າຕົວເອງ: ຂໍ້ມູນໂຄງການຂໍ້ມູນທີ່ສໍາຄັນນີ້ແມ່ນຜູ້ເຄາະຮ້າຍ, ຜູ້ຖືກກ່າວຫາ, ແລະຄະດີອາຍາໃນ Washington, DC. ທັງສອງເປັນວິທີທີ່ຈະມອບໃຫ້ແກ່ຜູ້ທີ່ເສຍຊີວິດແລະເປັນຊັບພະຍາກອນໃນການຮັບຮູ້ສໍາລັບປະຊາຊົນ, ໂຄງການຂໍ້ມູນຂະຫນາດໃຫຍ່ນີ້ແມ່ນຫນ້າສົນໃຈ.

ການວາງແຜນການເດີນທາງໂດຍຜ່ານການຂົນສົ່ງ, NYC: ນັກ ວິທະຍາສາດວິທະຍຸ WNYC Steve Melendez ໄດ້ລວມການກໍານົດເວລາລົດໄຟໃຕ້ດິນທີ່ມີໂຄງການເດີນທາງທ່ອງທ່ຽວ. ການສ້າງຂອງພຣະອົງເຮັດໃຫ້ New Yorkers ກົດບ່ອນຢູ່ຂອງເຂົາເຈົ້າໃນແຜນທີ່, ແລະການຄາດຄະເນກ່ຽວກັບເວລາເດີນທາງສໍາລັບລົດໄຟແລະລົດໄຟໃຕ້ດິນຈະປາກົດຂຶ້ນ.

Xerox ລົດການສູນເສຍແຮງງານຂອງເຂົາເຈົ້າ: ການເຮັດວຽກສູນກາງການໂທແມ່ນຄວາມອົດທົນທາງດ້ານຈິດໃຈ. Xerox ໄດ້ສຶກສາຂໍ້ມູນກ່ຽວກັບຂໍ້ມູນທີ່ມີຄວາມຊ່ວຍເຫຼືອຈາກນັກວິເຄາະມືອາຊີບແລະໃນປັດຈຸບັນພວກເຂົາສາມາດຄາດຄະເນວ່ານາຍຈ້າງທີ່ສູນການເຊົ່າຈະຢູ່ກັບບໍລິສັດທີ່ຍາວນານ.

ການສະຫນັບສະຫນູນການຕໍ່ຕ້ານການກໍ່ການຮ້າຍ: ໂດຍການສຶກສາສື່ມວນຊົນສັງຄົມ, ການບັນທຶກການເງິນ, ການວາງແຜນການບິນແລະຂໍ້ມູນຄວາມປອດໄພ, ການບັງຄັບໃຊ້ກົດຫມາຍສາມາດຄາດຄະເນແລະຊອກຫາຜູ້ຖືກກ່າວຫາກໍ່ການຮ້າຍກ່ອນທີ່ພວກເຂົາເຮັດການກະທໍາຊົ່ວຮ້າຍຂອງພວກເຂົາ.

ການປັບປຸງການຕະຫລາດຍີ່ຫໍ້ໂດຍອີງໃສ່ການທົບທວນສື່ມວນຊົນສັງຄົມ : ປະຊາຊົນເວົ້າຢ່າງແຈ່ມແຈ້ງແລະຢ່າງວ່ອງໄວກ່ຽວກັບຄວາມຄິດຂອງເຂົາເຈົ້າກ່ຽວກັບຮ້ານອາຫານ, ຮ້ານອາຫານ, ຫຼືສະໂມສອນຟິດ. ມັນເປັນໄປໄດ້ທີ່ຈະສຶກສາບົດລາຍງານສື່ມວນຊົນສັງຄົມເຫຼົ່ານີ້ຫລາຍລ້ານແລະໃຫ້ຄໍາຕອບກ່ຽວກັບບໍລິສັດກ່ຽວກັບສິ່ງທີ່ຄົນອື່ນຄິດກ່ຽວກັບການບໍລິການຂອງພວກເຂົາ.

ໃຜໃຊ້ຂໍ້ມູນໃຫຍ່? ພວກເຂົາເຮັດຫຍັງກັບມັນ?

ຫລາຍບໍລິສັດທີ່ໃຊ້ monolithic ໃຊ້ຂໍ້ມູນໃຫຍ່ເພື່ອປັບປຸງການສະເຫນີແລະລາຄາຂອງພວກເຂົາເພື່ອເພີ່ມຄວາມເພິ່ງພໍໃຈຂອງລູກຄ້າ.

ຂໍ້ມູນຂະຫນາດໃຫຍ່ເປັນຫຍັງຈຶ່ງເປັນບັນຫາໃຫຍ່?

4 ສິ່ງທີ່ເຮັດໃຫ້ຂໍ້ມູນທີ່ສໍາຄັນທີ່ສໍາຄັນ:

1. ຂໍ້ມູນແມ່ນຂະຫນາດໃຫຍ່. ມັນຈະບໍ່ເຫມາະສົມກັບ ຮາດດິດດຽວ , ສ່ວນຫຼາຍແມ່ນເປັນແຜ່ນ USB . ປະລິມານຂໍ້ມູນແມ່ນເກີນກວ່າສິ່ງທີ່ໃຈຂອງມະນຸດສາມາດຮັບຮູ້ໄດ້ (ຄິດວ່າມີຕື້ຕື້ເມັດເປີເຊັນ, ແລະເພີ່ມຈໍານວນຫຼາຍລ້ານຄັ້ງ).

2. ຂໍ້ມູນແມ່ນສັບສົນແລະບໍ່ມີໂຄງສ້າງ. 50% ຫາ 80% ຂອງການເຮັດວຽກຂໍ້ມູນຂະຫນາດໃຫຍ່ແມ່ນການປ່ຽນແປງແລະການທໍາຄວາມສະອາດຂໍ້ມູນດັ່ງນັ້ນຈຶ່ງສາມາດຄົ້ນຫາແລະຄັດເລືອກໄດ້. ມີພຽງແຕ່ສອງສາມພັນຜູ້ຊ່ຽວຊານໃນໂລກຂອງພວກເຮົາຢ່າງເຕັມທີ່ຮູ້ວິທີການເຮັດການລ້າງຂໍ້ມູນນີ້. ຜູ້ຊ່ຽວຊານເຫຼົ່ານີ້ຍັງຕ້ອງການເຄື່ອງມືພິເສດຕ່າງໆເຊັ່ນ HPE ແລະ Hadoop ເພື່ອເຮັດວຽກຂອງພວກເຂົາ. ບາງທີອາດມີໃນ 10 ປີ, ຜູ້ຊ່ຽວຊານຂໍ້ມູນໃຫຍ່ຈະກາຍເປັນຊິ້ນຫນຶ່ງໆ, ແຕ່ສໍາລັບໃນປັດຈຸບັນ, ພວກເຂົາເປັນນັກວິເຄາະທີ່ຫາຍາກຫຼາຍແລະວຽກງານຂອງພວກເຂົາແມ່ນຍັງບໍ່ຄ່ອຍແຈ້ງແລະຫນ້າເບື່ອ.

3. ຂໍ້ມູນໄດ້ກາຍເປັນສິນຄ້າ ** ທີ່ສາມາດຂາຍແລະຊື້ໄດ້. ຕະຫຼາດຂໍ້ມູນມີຢູ່ບ່ອນທີ່ບໍລິສັດແລະບຸກຄົນສາມາດຊື້ terabytes ຂອງສື່ສັງຄົມແລະຂໍ້ມູນອື່ນໆ. ຂໍ້ມູນສ່ວນໃຫຍ່ແມ່ນອີງໃສ່ເມັດ, ຍ້ອນວ່າມັນມີຂະຫນາດໃຫຍ່ເກີນໄປທີ່ຈະໃສ່ກັບແຜ່ນແຂງໃດຫນຶ່ງ. ການຊື້ຂໍ້ມູນທົ່ວໄປກ່ຽວຂ້ອງກັບຄ່າທໍານຽມການຈອງທີ່ທ່ານສຽບເຂົ້າໄປໃນຟາມເຄື່ອງແມ່ຂ່າຍຟັງ.

** ຜູ້ນໍາຂອງເຄື່ອງມືຂໍ້ມູນໃຫຍ່ແລະຄວາມຄິດເຫັນແມ່ນ Amazon, Google, Facebook ແລະ Yahoo. ເນື່ອງຈາກວ່າບໍລິສັດເຫຼົ່ານີ້ໃຫ້ບໍລິການຫລາຍລ້ານຄົນກັບການບໍລິການອອນໄລນ໌ຂອງພວກເຂົາ, ມັນເຮັດໃຫ້ຮູ້ສຶກວ່າພວກເຂົາຈະເປັນຈຸດເກັບກໍາແລະຄວາມຄິດເຫັນທີ່ຢູ່ເບື້ອງຫລັງການວິເຄາະຂໍ້ມູນໃຫຍ່.

4. ຄວາມເປັນໄປໄດ້ຂອງຂໍ້ມູນຂະຫນາດໃຫຍ່ແມ່ນບໍ່ມີທີ່ສິ້ນສຸດ. ບາງທີທ່ານອາດຈະຄາດຄະເນການໂຈມຕີຫົວໃຈແລະເສັ້ນເລືອດຕັນໃນມື້ຫນຶ່ງກ່ອນທີ່ພວກເຂົາຈະເກີດຂຶ້ນ. ອຸປະຕິເຫດເຮືອບິນແລະລົດໃຫຍ່ອາດຈະຖືກຫຼຸດລົງໂດຍການວິເຄາະການຄາດເດົາຂອງຂໍ້ມູນກົນຈັກຂອງເຂົາເຈົ້າແລະການຈະລາຈອນແລະຮູບແບບສະພາບອາກາດ. ການຫາຄູ່ອອນລາຍອາດຈະໄດ້ຮັບການປັບປຸງໂດຍມີການຄາດເດົາຂໍ້ມູນໃຫຍ່ຂອງຜູ້ທີ່ເປັນບຸກຄົນທີ່ເຂົ້າກັນໄດ້ສໍາລັບທ່ານ. ນັກດົນຕີອາດຈະໄດ້ຮັບຄວາມເຂົ້າໃຈກ່ຽວກັບສິ່ງທີ່ດົນຕີສ່ວນປະກອບທີ່ຫນ້າສົນໃຈທີ່ສຸດກັບການປ່ຽນແປງຂອງລົດຊາດຂອງປະຊາຊົນເປົ້າຫມາຍ. ນັກໂພຊະນາການອາດຈະສາມາດຄາດຄະເນການປະສົມປະສານຂອງອາຫານທີ່ຮ້ານຄ້າທີ່ຈະເພີ່ມຂຶ້ນຫຼືຊ່ວຍໃຫ້ສະພາບການທາງດ້ານສຸຂະພາບຂອງຄົນ. ພື້ນຜິວໄດ້ຖືກກັງວົນແລະຄົ້ນພົບໃນຂໍ້ມູນໃຫຍ່ໆເກີດຂຶ້ນທຸກໆອາທິດ.

Big Data Is Messy

Monty Rakusen / Getty

ຂໍ້ມູນໃຫຍ່ແມ່ນການວິເຄາະການຄາດເດົາ: ການປ່ຽນແປງຂໍ້ມູນທີ່ບໍ່ມີໂຄງສ້າງທີ່ໃຫຍ່ເປັນສິ່ງທີ່ຄົ້ນຫາແລະຄັດເລືອກ. ນີ້ແມ່ນຊ່ອງທີ່ສັບສົນແລະສັບສົນທີ່ຮຽກຮ້ອງໃຫ້ມີຄວາມຮູ້ພິເສດແລະຄວາມອົດທົນພິເສດ.

ເອົາຕົວຢ່າງເຊັ່ນການບໍລິການສົ່ງມອບ UPS. ນັກຂຽນໂປລແກລມທີ່ຂໍ້ມູນການສຶກສາຂອງ UPS ຈາກ GPS ຂອງຄົນຂັບແລະໂທລະສັບສະຫມາດຂອງພວກເຂົາເພື່ອວິເຄາະວິທີທີ່ມີປະສິດທິພາບທີ່ສຸດເພື່ອປັບຕົວກັບການຈະລາຈອນ. ຂໍ້ມູນ GPS ແລະໂທລະສັບສະຫຼາດນີ້ແມ່ນຂະຫນາດໃຫຍ່, ແລະບໍ່ອັດຕະໂນມັດກຽມພ້ອມສໍາລັບການວິເຄາະ. ຂໍ້ມູນນີ້ແມ່ນໃຊ້ໃນຖານຂໍ້ມູນ GPS ແລະຖານຂໍ້ມູນຕ່າງໆ, ຜ່ານອຸປະກອນຮາດແວໂທລະສັບສະຫຼາດທີ່ແຕກຕ່າງກັນ. ນັກວິເຄາະ UPS ໄດ້ໃຊ້ເວລາເດືອນແປງຂໍ້ມູນທັງຫມົດທີ່ເປັນຮູບແບບທີ່ສາມາດຄົ້ນຫາໄດ້ງ່າຍແລະຈັດຮຽງ. ເຖິງຢ່າງໃດກໍ່ຕາມ, ຄວາມພະຍາຍາມໄດ້ຮັບການຕົກລົງ. ໃນມື້ນີ້, UPS ໄດ້ຊ່ວຍປະຢັດນ້ໍາມັນຫຼາຍກວ່າ 8 ລ້ານແກັດນັບຕັ້ງແຕ່ພວກເຂົາເລີ່ມຕົ້ນນໍາໃຊ້ການວິເຄາະຂໍ້ມູນເຫຼົ່ານີ້.

ເນື່ອງຈາກຂໍ້ມູນທີ່ໃຫຍ່ແມ່ນສັບສົນແລະຮຽກຮ້ອງຄວາມພະຍາຍາມຫຼາຍປານໃດເພື່ອທໍາຄວາມສະອາດແລະກະກຽມສໍາລັບການນໍາໃຊ້, ນັກວິທະຍາສາດຂໍ້ມູນໄດ້ກາຍເປັນ "ຜູ້ປະສານງານຂໍ້ມູນ" ສໍາລັບວຽກງານທີ່ຫນ້າຕື່ນເຕັ້ນທີ່ເຂົາເຈົ້າເຮັດ.

ວິທະຍາສາດຂອງຂໍ້ມູນທີ່ໃຫຍ່ແລະການວິເຄາະການຄາດຄະເນແມ່ນການປັບປຸງທຸກໆອາທິດ, ເຖິງແມ່ນວ່າ. ຄາດວ່າຂໍ້ມູນໃຫຍ່ຈະສາມາດເຂົ້າເຖິງໄດ້ງ່າຍພ້ອມກັບທຸກຄົນໂດຍປີ 2025.

ບໍ່ແມ່ນຂໍ້ມູນໃຫຍ່ທີ່ເປັນໄພຂົ່ມຂູ່ຕໍ່ຄວາມເປັນສ່ວນຕົວ?

Feingersh / Getty

ແມ່ນ, ຖ້າກົດຫມາຍຂອງພວກເຮົາແລະການປົກປ້ອງຄວາມເປັນສ່ວນຕົວຂອງແຕ່ລະບຸກຄົນບໍ່ໄດ້ຮັບການຄຸ້ມຄອງຢ່າງລະມັດລະວັງ, ຫຼັງຈາກນັ້ນຂໍ້ມູນໃຫຍ່ເຂົ້າມາໃນຄວາມເປັນສ່ວນຕົວຂອງສ່ວນບຸກຄົນ. ໃນຖານະເປັນມັນຢືນ, ກູໂກແລະ YouTube ແລະເຟສບຸກໄດ້ຕິດຕາມນິໄສອອນໄລນ໌ຂອງທ່ານປະຈໍາວັນ . ຊີວິດໂທລະສັບສະຫຼາດແລະຄອມພິວເຕີຂອງທ່ານເຮັດໃຫ້ບັນດາເຕັກໂນໂລຢີດິຈິຕອນທຸກໆມື້, ແລະບໍລິສັດທີ່ມີຄວາມຊໍານິຊໍານານແມ່ນການສຶກສາບັນດາຮອຍຕີນເຫຼົ່ານັ້ນ.

ກົດຫມາຍທີ່ກ່ຽວຂ້ອງກັບຂໍ້ມູນຂະຫນາດໃຫຍ່ແມ່ນມີການປ່ຽນແປງ. ຄວາມເປັນສ່ວນຕົວແມ່ນລັດແຫ່ງການເປັນທີ່ທ່ານຕ້ອງຮັບຜິດຊອບສ່ວນບຸກຄົນສໍາລັບ, ດັ່ງທີ່ທ່ານບໍ່ສາມາດຄາດຫວັງວ່າມັນເປັນສິດທີ່ຖືກຕ້ອງ.

ສິ່ງທີ່ທ່ານສາມາດເຮັດເພື່ອປົກປ້ອງຄວາມເປັນສ່ວນຕົວຂອງທ່ານ:

ຂັ້ນຕອນດຽວທີ່ໃຫຍ່ທີ່ສຸດທີ່ທ່ານສາມາດໃຊ້ແມ່ນການປະຕິບັດນິໄສປະຈໍາວັນຂອງທ່ານໂດຍໃຊ້ການເຊື່ອມຕໍ່ເຄືອຂ່າຍ VPN . ບໍລິການ VPN ຈະ scramble ສັນຍານຂອງທ່ານເພື່ອໃຫ້ແຫຼ່ງຂໍ້ມູນແລະຕໍາແຫນ່ງຂອງທ່ານຖືກປິດກັ້ນຢ່າງຫນ້ອຍບາງສ່ວນຈາກຜູ້ຕິດຕາມ. ນີ້ຈະບໍ່ເຮັດໃຫ້ທ່ານ 100% ຊື່ສຽງ, ແຕ່ VPN ຈະຫຼຸດລົງຢ່າງຫຼວງຫຼາຍເທົ່າໃດໂລກສາມາດສັງເກດເບິ່ງນິໄສອອນໄລນ໌ຂອງທ່ານ.

ຂ້ອຍສາມາດຮຽນຮູ້ເພີ່ມເຕີມກ່ຽວກັບຂໍ້ມູນໃຫຍ່ໄດ້ບໍ?

Monty Raskusen / Getty

ຂໍ້ມູນໃຫຍ່ແມ່ນສິ່ງທີ່ຫນ້າສົນໃຈສໍາລັບຜູ້ທີ່ມີໃຈຄິດໄລ່ແລະຄວາມຮັກສໍາລັບເຕັກໂນໂລຢີ. ຖ້າຫາກວ່າທ່ານ, ຫຼັງຈາກນັ້ນແນ່ນອນໄປຢ້ຽມຢາມຫນ້ານີ້ຂອງໂຄງການຂໍ້ມູນທີ່ຫນ້າສົນໃຈໃຫຍ່.