BigQuery – poziom zaawansowany

Zaawansowane techniki analizy danych i automatyzacji zapytań w środowisku BigQuery
    Czas trwania
    Godzina rozpoczęcia
    Stopień trudności

      BigQuery – poziom zaawansowany

      Zaawansowane techniki analizy danych i automatyzacji zapytań w środowisku BigQuery

      Opis szkolenia

      BigQuery to skalowalne i wydajne narzędzie do analizy danych w chmurze Google Cloud Platform. Wspiera standard SQL i umożliwia przetwarzanie petabajtów danych w czasie rzeczywistym bez potrzeby zarządzania infrastrukturą. Jest podstawą nowoczesnych rozwiązań analitycznych i Big Data w chmurze.

      Poznaj program szkolenia

      Co zyskasz dzięki szkoleniu ?

      Cele szkolenia

      Szkolenie pozwala uczestnikom:

      • opanować zaawansowane techniki przetwarzania i analizy danych w BigQuery,
      • zrozumieć i stosować funkcje analityczne i okienkowe do tworzenia dynamicznych raportów,
      • automatyzować przetwarzanie danych poprzez tworzenie procedur i funkcji użytkownika,
      • rozszerzyć swoje umiejętności z zakresu zarządzania błędami zapytań SQL,
      • lepiej integrować dane BigQuery z innymi narzędziami, takimi jak Excel.


      Umiejętności

      Dzięki szkoleniu  uczestnik będzie:

      • Łączyć dane z różnych źródeł z wykorzystaniem UNION, INTERSECT, EXCEPT.
      • Tworzyć i zarządzać widokami w BigQuery.
      • Pobierać dane do Excela przy użyciu Power Query.
      • Wykorzystywać zaawansowane klauzule grupujące: ROLLUP, CUBE, GROUPING SETS.
      • Pisać zagnieżdżone zapytania oraz korzystać z CTE (konstrukcja WITH).
      • Tworzyć raporty z użyciem funkcji rankingowych: ROW_NUMBER, RANK, DENSE_RANK.
      • Wykonywać porównania okresowe (np. miesiąc do miesiąca) z wykorzystaniem LAG i LEAD.
      • Stosować PIVOT i UNPIVOT w celu transformacji danych.
      • Obsługiwać funkcje okien (Window Functions), np. NTILE.
      • Tworzyć procedury i funkcje użytkownika z wykorzystaniem zmiennych, warunków i pętli.
      • Obsługiwać błędy za pomocą funkcji SAFE_* i ERROR().
      Czy to szkolenie jest dla Ciebie ?

      Profil uczestników

      Szkolenie jest przeznaczone dla:

      • analityków danych, specjalistów BI, data scientistów,
      • programistów pracujących z BigQuery lub planujących migrację danych do tego środowiska,
      • specjalistów IT odpowiedzialnych za integrację, raportowanie i analizę danych,
      • osób odpowiedzialnych za automatyzację przetwarzania danych

      Przygotowanie uczestników

      Uczestnicy powinni:

      • znać podstawowe konstrukcje SQL (SELECT, JOIN, WHERE, GROUP BY),
      • mieć doświadczenie w pracy z bazami danych (preferowane środowisko BigQuery),
      • znać podstawowe pojęcia związane z analityką danych i przetwarzaniem zapytań,

      UWAGA! Comarch nie dostarcza w przypadku tego szkolenia środowiska dla uczestników. Uczestnicy pracują na środowisku udostępnionym przez ich firmę.

      Czas trwania szkolenia

      Przed nami:

      • 2 dni, 16 godzin szkoleniowych
      Szczegółowy program szkolenia

      Szczegółowy program szkolenia

      Powtórzenie/przypomnienie informacji o podstawowych konstrukcjach zapytań SELECT

      • Wykorzystanie aliasów (AS) dla kolumn i tabel
      • Grupowanie danych
      • Instrukcje warunkowe
      • Złączenia tabel

      Łączenie zbiorów danych 

      • UNION, UNION ALL, INTERSECT, EXCEPT

      Przygotowywanie widoków

      • Tworzenie widoków z gotowych zapytań
      • Obsługa widoków

      Pobieranie danych z bazy danych do Excel przy pomocy PowerQuery

      • Pobieranie danych z tabel, widoków
      • Wykorzystanie instrukcji SELECT do importu danych

      Rozszerzone klauzule grupujące

      • Wykorzystanie klauzul ROLLUP, CUBE, GROUPING, GROUPING SETS

      Zagnieżdżanie zapytań

      • Select w zapytaniu SELECT
      • CTE - Wykorzystanie konstrukcji WITH

      Funkcje analityczne

      • Funkcje raportujące, rankingowe np. ROW_NUMBER, RANK, DENSE_RANK
      • PARTITION BY, ORDER BY w funkcjach okiennych
      • Zagnieżdżanie agregacji, np. SUM(COUNT)
      • Poruszanie się po rekordach - LIMIT, OFFSET
      • Raporty okres do okresu, np. miesiąc do miesiąca – LAG, LEAD
      • Piwotowanie i de-piwotowanie danych - PIVOT, UNPIVOT
      • Korzystanie z funkcji okna (Window Functions), np. NTILE
      • Zamiennik CROSS APPLY: JOIN z UNNEST()
      • Zamiennik OUTER APPLY: LEFT JOIN z QUALIFY 

      Procedury użytkownika

      • Tworzenie procedur
      • Zmienne i stałe - deklarowanie, zakres życia
      • Konstrukcje sterujące przepływem programu (warunki IF, pętle WHILE)
      • Instrukcja CASE
      • Procedury i funkcje - różne tryby przekazywania parametrów, zwracanie wartości
      • Różnice i podobieństwa w wykorzystaniu zmiennych tabelarycznych oraz tabel tymczasowych

      Funkcje użytkownika

      • Funkcje skalarne i użytkownika (Scalar and User-defined Functions)

      Obsługa błędów

      • Pozyskiwanie informacji o błędach
      • Funkcja ERROR()
      • SAFE_CAST(), SAFE_OFFSET(), SAFE_DIVIDE()

      Metoda realizacji szkolenia

      Szkolenie realizowane jest w formie naprzemiennie następujących po sobie mini wykładów oraz ćwiczeń praktycznych. Szkolenie łączy w sobie fachową wiedzę merytoryczną z praktycznymi przykładami jej wykorzystania w środowisku pracy.

      POBIERZ PROGRAM W PDF

      W ramach szkolenia zapewniamy

      W ramach szkolenia zapewniamy

      • materiały szkoleniowe
      • certyfikat potwierdzający udział w kursie
      • pełna obsługa cateringowa
      Zobacz również
      • Python dla analizy danych
      • Google Cloud Platform
      • Google Looker Studio, Tableau lub Power BI

      Podobne szkolenia