Wyjaśnienie IT: co to jest jezioro danych?

-

Świat staje się Podwójna jego rozmiar każdego roku i zamienia się w cyfrowy wszechświat. Rozmiar jest określany przez konieczność danych. Codziennie, ponad 2.5 trylionów bajtów danych jest generowany na całym świecie i jest oczekuje się, że do 5.2 r. wzrośnie o 2025 zetabajta. Pandemia wpływa również na gwałtowny wzrost w 2020 roku. Zarządzanie dużą liczbą danych wymaga rozwiązania takiego jak jezioro danych.

Nowoczesne firmy są w dużym stopniu uzależnione od ogromnych i zróżnicowanych danych oraz centra danych są kluczem do tworzenia dużych zbiorów danych. Ponad 90% danych jest częściowo ustrukturyzowanych lub nieustrukturyzowanych, co zapoczątkowało podwójne wyzwanie. W związku z tym 95% właścicieli firm szuka sposobu na zarządzanie nieustrukturyzowanymi danymi. Wszyscy potrzebują ekskluzywnego i zorganizowanego rozwiązania, aby zapewnić bezpieczeństwo ważnych danych i informacji organizacyjnych. Wymaga to również utrzymania wydajności dzięki szybszemu zakładowi przetwarzania. Dlatego jezioro danych może być idealnym rozwiązaniem.

Co to jest jezioro danych?

Data Lake to centralne repozytorium, w którym przechowywane są duże dane ze źródeł w oryginalnym formacie, dopóki firmy z nich nie skorzystają. Dane mogą być ustrukturyzowane, częściowo ustrukturyzowane lub nieustrukturyzowane z możliwością wykorzystania w przyszłości. To sprawia, że ​​jezioro danych w połączeniu z różnymi punktami i kształtami nieprzetworzonych danych zapewnia przydatne informacje do dostosowywania do potrzeb klientów.

Jezioro danych
Zdjęcie: Faraha Rahman Lamiya

Przechowywanie danych w Data Lake wiąże się z identyfikatorami i tagami metadanych w celu szybkiego ratowania. Obejmuje setki terabajtów lub petabajtów do przechowywania symulowanych danych ze źródeł operacyjnych, w tym baz danych i platform SaaS. Jezioro danych może być również używane jako platforma źródłowa, która umożliwia przechowywanie danych i narzędzia pomocnicze w celu zrozumienia danych poprzez szybką eksplorację w celu uzyskania zaawansowanej analityki. Śledzi pochodzenie, narzucone zabezpieczenia, a także scentralizowany audyt zachowując swój standard.

Kto tego potrzebuje?

Thomasa H. Davenporta, raz wybitny profesor prezydencki w dziedzinie informatyki i zarządzania powiedziany, „Każda firma ma w przyszłości duże zbiory danych i każda firma w końcu znajdzie się w branży danych”. W ten sposób przechowywanie danych jest przyzwyczajone w Data Lake, ponieważ opiera się na zestawie rozsądnych i przystępnych usług. Przedsiębiorstwa mają wpływ na jeziora danych, ponieważ pomagają w stworzeniu scentralizowanego miejsca do zarządzania infrastrukturą. Każda organizacja może zarządzać, przechowywać, analizować i klasyfikować swoje dane zrzucane do jeziora. Zawsze mogą go użyć do dalszych potrzeb, ponieważ istnieje on lokalnie lub w chmurze.

Jeśli Twoja organizacja wnosi wartość dodaną z generowanych danych biznesowych, to masz duże możliwości, by pokonać swoich konkurentów. Według ankiety przeprowadzonej w Aberdeen, organizacje uzyskały 9% wzrost przychodów niż inne dzięki wdrożeniu w jeziorze danych, które ma lepsze wyniki. Stali się liderami, aby umożliwić nowe analizy, takie jak uczenie maszynowe, z nowszych źródeł przechowywanych w jeziorze danych. Stworzyło to pewne możliwości szybszego rozwoju firmy poprzez przyciąganie i zatrzymywanie klientów, zwiększanie produktywności, proaktywną konserwację urządzeń i świadome podejmowanie decyzji.

Korzyści

Korzyści z jeziora danych dla firm obejmują:

  • Dane pozostają dostępne i zapewnia to pracownikom mogą mieć dostęp, kiedy tylko tego potrzebują.
  • Niedroga dostępność do przechowywania ogromnej ilości danych dodaje przedsiębiorstwom wartości finansowej, mimo że wymaga formalnej orientacji w przetwarzaniu i analizowaniu. .
  • Data Lake oferuje różne warianty, a firmy mogą gromadzić dane w przyszłości, ponieważ są one zapisywane w natywnym formacie, dzięki czemu można ich używać i dodawać wielokrotnie bez ograniczeń.
  • Adaptacja do nieodłącznych zmian zgodnie z postępem w technologii danych ułatwia odzyskiwanie niezbędnych danych w przyszłości.
  • Wykorzystanie jeziora danych umożliwia analitykę w czasie rzeczywistym, dostarczając wysokiej jakości dane i algorytmy głębokiego uczenia, aby podkreślić analitykę decyzyjną firmy.
  • Elastyczność w zakresie obsługi SQL i innych języków programowania przygotowuje do zaawansowanych wymagań.
  • Zaradność to kolejna korzyść, ponieważ dane przechowywane w Data Lake mogą mieć różne źródła i wiele mediów, czatów, danych społecznościowych, binarnych lub w dowolnym innym formacie.

Pamięć masowa i zasoby komputerowe są rozdzielone, aby zachować resztę danych w zabudżetowanej pamięci obiektowej, takiej jak Hadoop lokalnie lub Amazon S3. Różne narzędzia i usługi, takie jak Apache Presto, Elasticsearchlub Amazonka Atena może służyć do zapytania o dane.

Jezioro danych zapoczątkowało podejście „przechowuj teraz, analizuj później” z niewielkim wysiłkiem przyswajania danych do jeziora. Często definiuje się go jako strukturę big data, która zobowiązuje wiele usług analitycznych. Jednak nadal zapewnia jedno tempo zapisywania i uzyskiwania dostępu do cennych danych przedsiębiorstwa oraz zwiększania progu biznesowego, a także korzyści dla jego użytkowników. .


YouTube: wyjaśnienie Adama Kocoloskiego, IBM

Co to jest Data Lake?

Klikając przycisk „Odtwórz”, wyrażasz zgodę na regulamin serwisu YouTube Regulamin oraz Polityka PrywatnościDane mogą być udostępniane serwisom YouTube/Google.

Kredyty fotograficzne: funkcja obraz został zajęty przez Becca Tapert. Infografika w treści artykułu została wykonana przez autora dla TechAcute.
Źródła: Jacquelyn Bulao (Jury techniczne) / Ideologia danych / Aberdeen

Faraha Rahman Lamija
Faraha Rahman Lamija
Cześć, tu Faraha, entuzjastyczny dziennikarz techniczny w TechAcute. Dziękuję za przeczytanie mojego artykułu. Mam nadzieje ze ci się podobało. Staram się przekazywać Ci najświeższe informacje dotyczące ekscytujących innowacji technologicznych lub czegoś, czego chciałbyś się nauczyć. Jeśli chcesz się przywitać, pukaj do mnie gdzie chcesz.
- Reklama -
- Reklama -
- Reklama -
- Reklama -
- Reklama -
- Reklama -
- Reklama -
- Reklama -
- Reklama -
- Reklama -
- Reklama -