Ipinaliwanag IT: Ano ang Isang Lake ng Data?

-

Ang mundo ay nagiging double laki nito bawat taon at nagiging isang digital na uniberso. Ang laki ay natutukoy ng pangangailangan ng data. Araw-araw, higit sa 2.5 quintillion bytes ng data ay nabuo sa buong mundo at ito ay inaasahang lalago ang 5.2 zettabytes sa 2025. Naiimpluwensyahan din ng pandemya ang mabilis na pag-akyat noong 2020. Upang pamahalaan ang isang malaking bilang ng mga data ay nangangailangan ng isang solusyon tulad ng isang lawa ng data.

Ang mga modernong negosyo ay lubos na umaasa sa malawak at magkakaibang data, at mga sentro ng data ang susi upang makabuo ng malaking data. Mahigit sa 90% ng data ay medyo nakabalangkas o hindi nakaayos na nagsimula ng isang dalawang beses na hamon. Tulad ng naturan, 95% ng mga may-ari ng negosyo ay naghahanap ng isang paraan upang pamahalaan ang hindi nakaayos na data. Ang lahat sa kanila ay nangangailangan ng isang eksklusibo at organisadong solusyon upang matiyak ang kaligtasan ng maimpluwensyang data ng impormasyon at impormasyon. Kailangan din nito ang pagpapanatili ng kapasidad na may isang mas mabilis na pasilidad sa pagproseso. Samakatuwid, ang data lake ay maaaring maging isang perpektong solusyon.

Ano ang isang data lake?

Ang isang data lake ay isang gitnang imbakan ng imbakan na nagtataglay ng malaking data mula sa mga mapagkukunan sa orihinal na format hanggang magamit ito ng mga negosyo. Ang data ay maaaring nakaayos, semi-nakabalangkas, o hindi nakaayos na may kakayahang umangkop na magamit sa hinaharap. Gumagawa ito ng isang lawa ng data na sinamahan ng iba't ibang mga punto at hugis ng hilaw na data na nagbibigay ng mga kapaki-pakinabang na pananaw para sa pagpapasadya upang matugunan ang mga pangangailangan ng mga customer.

lawa ng data
Larawan: Faraha Rahman Lamiya

Ang pag-iimbak ng data sa data na nauugnay sa lawa sa mga identifier at metadata na tag para sa isang mabilis na pagligtas. Nagsasama ito ng daan-daang mga terabyte o petabyte upang mag-imbak ng simulate na data mula sa mga mapagkukunan sa pagpapatakbo kabilang ang mga database at mga platform ng SaaS. Ang isang data lake ay maaari ding magamit bilang isang mapagkukunan ng platform na nagbibigay-daan sa pag-iimbak ng data at mga tool sa suporta upang maunawaan ang data sa pamamagitan ng mabilis na paggalugad para sa advanced na analytics. Sinusubaybayan nito ang lipi, ipinataw ang seguridad pati na rin ang sentralisadong pag-audit na pinapanatili ang pamantayan nito.

Sino ang nangangailangan nito?

Thomas H. Davenport, ang Distinguished Professor ng Pangulo sa IT at Pamamahala nang isang beses sinabi, "Ang bawat kumpanya ay may malaking data sa hinaharap at bawat kumpanya sa kalaunan ay nasa data na negosyo." Ito ay kung paano nakasanayan ang pag-iimbak ng data sa lawa ng data sapagkat ito ay nabubuo sa isang pagpupulong ng makatwiran at aakyat na serbisyo. Ang mga negosyo ay naiimpluwensyahan ng mga lawa ng data dahil nakakatulong ito sa paglikha ng isang sentralisadong lugar para sa pamamahala ng mga imprastraktura. Ang bawat organisasyon ay maaaring pamahalaan, maiimbak, pag-aralan, at uriin ang kanilang data na itinapon sa lawa. Palagi nila itong magagamit para sa karagdagang pangangailangan sapagkat umiiral ito sa mga nasasakupang lugar o sa ulap.

Kung ang iyong organisasyon ay nagdaragdag ng halaga mula sa nabuong data ng negosyo, kung gayon ang mga posibilidad na matalo ang iyong mga kapantay. Ayon sa isang survey ng Aberdeen, nakakuha ang mga organisasyon ng 9% na paglago ng kita kaysa sa iba para sa pagpapatupad sa isang data lake na mas mataas ang performance. Sila ang naging mga pinuno upang paganahin ang bagong analytics tulad ng machine learning mula sa mga mas bagong source na nakaimbak sa data lake. Lumikha ito ng ilang partikular na pagkakataon para sa mas mabilis na paglago ng negosyo sa pamamagitan ng pag-akit at pagpapanatili ng mga customer, pagpapahusay sa pagiging produktibo, proactive na pagpapanatili ng device, at matalinong paggawa ng desisyon.

Mga Benepisyo

Ang mga pakinabang ng isang data lake para sa mga negosyo ay kasama ang:

  • Ang data ay nananatiling magagamit at tinitiyak na ang mga empleyado maaaring magkaroon ng access sa tuwing kailangan nila ito.
  • Ang murang accendibility upang mag-imbak ng malawak na data ay nagdaragdag ng pinansiyal na halaga sa mga negosyo kahit na nangangailangan ito ng ilang pormal na oryentasyon para sa pagproseso at pag-aaral.
  • Nag-aalok ang data lake ng mga pagkakaiba-iba at maaaring maiimbak ng mga kumpanya ang data sa hinaharap dahil nai-save ito sa katutubong format upang magamit ito at maidagdag ng maraming beses nang walang mga paghihigpit.
  • Adaptive sa likas na mga pagbabago ayon sa pagsulong sa teknolohiya ng data na ginagawang mas madali upang makuha ang kinakailangang data sa hinaharap.
  • Ang leverage ng data lake ay nagbibigay-daan sa real-time analytics sa pamamagitan ng pagbibigay ng kalidad ng data at malalim na mga algorithm sa pag-aaral upang bigyang-diin ang analytics ng desisyon ng negosyo.
  • Ang kakayahang umangkop upang suportahan ang SQL at iba pang mga wika ng pagprograma ay umaayos sa mga advanced na kinakailangan.
  • Ang pagiging mapagkukunan ay isa pang pakinabang dahil ang data na nakaimbak sa data lake ay maaaring magkaroon ng magkakaibang mapagkukunan at maramihang media, chat, social data, binary, o anumang iba pang format.

Ang pag-iimbak at pag-aari ng computer ay pinaghiwalay upang mapanatili ang natitirang data sa na-budget na imbakan ng object tulad ng Hadoop nasa saligan o Amazon S3. Iba't ibang mga tool at serbisyo tulad ng Apache Presto, Elasticsearch, O Amazon Athena maaaring magamit para sa isang query sa data.

Ang lawa ng data ay nagmula sa diskarte ng "mag-imbak ngayon, pag-aralan sa paglaon" na may kaunting pagsisikap na ingesting ang data sa lawa. Ito ay madalas na tinukoy na maging isang malaking istraktura ng data upang obligahin ang maraming mga serbisyo ng analytic. Ngunit nagbibigay pa rin ng isang solong tulin upang mai-save at ma-access ang mahalagang data ng enterprise at mapataas ang threshold ng negosyo pati na rin ang mga benepisyo sa mga gumagamit nito.


YouTube: Paliwanag ni Adam Kocoloski, IBM

Ano ang Data Lake?

Sa pamamagitan ng pag-click sa play, sumasang-ayon ka sa YouTube Mga palatuntunan at Pribadong Patakaran. Maaaring ibahagi ang data sa YouTube/Google.

Mga kredito sa larawan: Ang tampok larawan ay kinuha ng Becca Tapert. Ang infographic sa katawan ng artikulo ay ginawa ng may-akda para sa TechAcute.
Pinagmulan: Jacquelyn Bulao (Techjury) / Ideolohiya ng Data / Aberdeen

Faraha Rahman Lamiya
Faraha Rahman Lamiya
Kumusta, ito si Faraha, isang masigasig na tech na mamamahayag sa TechAcute. Salamat sa pagbabasa ng aking artikulo. Sana nagustuhan mo. Sinusubukan kong ibigay sa iyo ang pinakabagong mga update tungkol sa mga kapana-panabik na makabagong teknolohiya o isang bagay na gusto mong matutunan. Kung gusto mong mag-Hi, kumatok ka sa akin kung saan mo gusto.
- Advertising -
- Advertising -
- Advertising -
- Advertising -
- Advertising -
- Advertising -
- Advertising -
- Advertising -
- Advertising -
- Advertising -
- Advertising -