Hurtownie danych

Przedsiębiorstwa, które w ramach prowadzenia swojej działalności generują duże ilości danych, często budują hurtownie danych, które integrują dane z wszystkich źródeł.

Hurtownia danych jest niezbędnym składnikiem systemu IT w przedsiębiorstwie.

Gromadzenie danych bieżących i historycznych

Poukładane dane stanowią podstawę do prowadzenia wszelkiego rodzaju analiz i raportów – czyli realizowania dostępu do wszelkich informacji wykorzystywanych w firmie. Hurtownie danych są zoptymalizowane do obsługi sporej ilości zapytań i wykonywania analiz, przechowują duże ilości danych historycznych.

Architektura hurtowni danych i proces ETL

Dane historyczne ładowane są zazwyczaj z wielu systemów źródłowych, baz danych, tematycznych hurtowni danych czy nawet pojedynczych plików płaskich w czasie najmniejszego obciążenia źródeł - wykorzystuje się do tego proces ETL (extract, transform, load). Proces ETL odpowiada za zebranie danych historycznych z baz danych systemów źródłowych, ich przetworzenie, oczyszczenie, zintegrowanie oraz ładowanie do obszaru przejściowego hurtowni danych, do którego użytkownicy biznesowi nie posiadają najczęściej dostępu.

Warstwa metadanych hurtowni danych gromadzi zarówno informacje biznesowe (tabele wymiarów, data marty, agregaty) oraz dane techniczne (mapowania, transformacje). Finalnie, przechowywanie danych dostępnych dla użytkowników biznesowych odbywa się w warstwie prezentacji. Za pomocą narzędzi raportowych użytkownicy otrzymują dostęp do danych historycznych przechowywanych w data martach, kostkach OLAP.

Hurtownia danych - zalety

Najważniejsze korzyści płynące z wdrożenia hurtowni danych w przedsiębiorstwie:        

  • Agregacja danych umożliwiająca szybki dostęp do potrzebnych informacji
  • Możliwość przechowywania danych w chmurze (niższe koszty)
  • Przekrojowe analizy ze wszystkich danych systemów źródłowych
  • Jedno źródło prawdy
  • Przechowywanie najwyższej jakości jednorodnych danych

Baza danych a hurtownia danych

Comarch Business Intelligence pozwala gromadzić i w bezpieczny sposób przechowywać informacje w hurtowaniach danych, tworzyć różnego rodzaju analizy, w prosty i przyjazny sposób dokonywać pobierania i transformacji danych z różnych źródeł.

Dane ładowane są zazwyczaj z wielu systemów źródłowych, hurtowni danych czy nawet pojedynczych plików płaskich w czasie najmniejszego obciążenia źródeł - wykorzystuje się do tego proces ETL.

Projektowanie hurtowni danych

Jakość danych

Częścią procesu ładowania danych jest proces Data Quality – dbający o jakość danych. Niejednokrotnie czynnik ludzki powoduje błędne analizy, a co za tym idzie – chybione decyzje. W analizach mogą pojawiać się duplikaty pozycji, błędy językowe, braki w danych itp.

Takie niespójności i błędy usuwane są w procesie Data Quality poprzez pełną walidację analizowanych danych – dzięki czemu hurtownia danych oferuje większą pewność poprawności informacji.

Zazwyczaj stosuje się tutaj zestawy reguł formalnych i biznesowych, opisujących dane procesy zachodzące w przedsiębiorstwie.

Projektowanie hurtowni danych

Obszary analiz danych

Pojęcie to jest związane z obszarami analitycznymi i analizami wielowymiarowymi. Popularnym rozwiązaniem jest tutaj OLAP, czyli kostka analityczna.

Dzięki temu dane mogą być wydajnie przetwarzane, jak również przechowywane w modelach zrozumiałych biznesowo opartych o fakty, miary i wymiary.

Bardzo ważne również w kontekście obszarów analitycznych są metadane, które stanowią informacje na temat rodzaju przechowywanych danych, ich zakresu, poprawności itp. Jest to istotny element wpływający na zachowanie uporządkowanej struktury danych w firmie.

Obszary analiz danych

Znaczenie hurtowni danych w firmie

Comarch Data Warehouse Manager - DWM

  • Jest to element Comarch Business Intelligence, który gromadzi w sobie wszystkie moduły do integracji i zarządzania hurtownią danych.
  • Zadaniem Comarch DWM jest wspomaganie i nadzorowanie procesu zasilania hurtowni daych, administrowanie, porządkowanie i opisywanie poszczególnych danych.
  • Zastosowanie poszczególnych modułów zależne jest od specyfiki realizowanego projektu, ilości i różnorodności źródeł danych oraz potrzeb klienta.

Aplikacja Comarch DWM jest odpowiedzialna m.in. za:

  • Zarządzanie strukturą hurtowni danych,
  • Zarządzanie procesem ładowania i transformacjami,
  • Logowanie zdarzeń podczas procesu ładowania i transformacji, oraz informowanie administratorów,
  • Nadzór i procesowanie dodatkowych mapowań, grupowań, rozbić i utrzymanie słowników w dodatkowych źródłach danych.

Hurtownia danych - zagregowane dane podstawą raportowania i podejmowania decyzji

Comarch Business Intelligence pozwala gromadzić dane historyczne i w bezpieczny sposób przechowywać informacje w hurtowaniach danych, tworzyć różnego rodzaju analizy, w prosty i przyjazny sposób dokonywać pobierania i transformacji danych z różnych źródeł.

Użytkownicy biznesowi otrzymują możliwość łatwej analizy zagregowanych danych historycznych. Dostęp do hurtowni danych zapewniony jest poprzez intuicyjne narzędzie raportowe – Comarch BI Point, które jest dostępne także na urządzeniach mobilnych.

Skontaktuj się z ekspertem Comarch

Określ swoje potrzeby biznesowe. My zaoferujemy Ci opiekę informatyczną i dedykowane rozwiązanie.

Przejdź do formularza