Comarch Bootcamp - Analiza Danych dla Analityków 2.0

Co zyskasz dzięki szkoleniu ?

Cele szkolenia

Celem szkolenia jest przygotowanie uczestników do samodzielnej pracy analitycznej poprzez rozwój wiedzy i praktycznych umiejętności w zakresie pracy z danymi. W szczególności szkolenie ma na celu:

zrozumienie roli analizy danych w podejmowaniu decyzji biznesowych,
poznanie pełnego procesu analizy danych – od zdefiniowania problemu biznesowego po prezentację wyników,
opanowanie narzędzi wykorzystywanych w pracy analityka danych,
rozwój umiejętności pracy z danymi pochodzącymi z różnych źródeł,
poznanie metod modelowania danych i przygotowywania ich do analizy,
rozwój umiejętności wizualizacji danych i tworzenia raportów analitycznych,
poznanie możliwości wykorzystania sztucznej inteligencji w analizie danych,
przygotowanie uczestników do wdrażania rozwiązań analitycznych w organizacji.

Umiejętności

Dzięki szkoleniu uczestnik będzie:

pozyskiwać dane z różnych źródeł, takich jak pliki, bazy danych, systemy informatyczne czy interfejsy API,
przygotowywać i przekształcać dane do dalszej analizy, w tym czyścić dane oraz integrować je z wielu źródeł,
pracować z relacyjnymi bazami danych i tworzyć zapytania w języku SQL,
budować modele danych w narzędziach Excel i Power BI,
tworzyć analizy, raporty i interaktywne dashboardy wspierające podejmowanie decyzji biznesowych,
wykorzystywać język Python do analizy danych, automatyzacji pracy oraz przetwarzania większych zbiorów danych,
stosować podstawowe metody statystyczne i elementy uczenia maszynowego w analizie danych,
wykorzystywać narzędzia sztucznej inteligencji do wspomagania analizy danych i automatyzacji pracy analitycznej,
interpretować wyniki analiz i formułować wnioski biznesowe,
prezentować wyniki analiz w sposób czytelny i zrozumiały dla interesariuszy.

Dodatkowo uczestnicy poznają zasady wdrażania projektów analitycznych w przedsiębiorstwie, zarządzania jakością danych oraz komunikowania wyników analiz w organizacji. Program obejmuje także elementy rozwoju kariery, które pomagają przygotować się do pracy w zawodzie analityka danych i budować dalszą ścieżkę zawodową w obszarze data analytics.

Czy to szkolenie jest dla Ciebie ?

Profil uczestników

Bootcamp jest przeznaczony dla osób, które posiadają wiedzę z zakresu zastosowania arkusza kalkulacyjnego oraz podstaw statystyki i relacyjnych baz danych, a zamierzają pracować w zawodzie analityka danych.

Przygotowanie uczestników

Od uczestników naszego intensywnego szkolenia z analizy danych wymagana jest znajomość:

Microsoft Excel w stopniu przynajmniej dobrym
podstaw teoretycznych statystyki
podstaw relacyjnych baz danych (nie jest wymagana znajomość konkretnego języka dostępu do bazy danych ani konkretnej platformy bazodanowej).

Nie jest wymagane wykształcenie kierunkowe.

Czas trwania

26 dni, 208 godzin szkoleniowych

Harmonogram spotkań

- harmonogram w trakcie ustalania

Szczegółowy program szkolenia

Moduł 1. Organizacja i przebieg procesu analizy danych

1.1. Wprowadzenie do analizy danych

• Czym jest analiza danych – definicja, cele, znaczenie biznesowe

• Rola analityka danych w organizacji

• Rodzaje analiz: opisowa, diagnostyczna, predykcyjna, preskrypcyjna

• Przegląd narzędzi analitycznych stosowanych w kursie

• Etyka i odpowiedzialność w pracy z danymi

1.2. Metodyka CRISP-DM

• Omówienie faz metodyki CRISP-DM:

◦ Zrozumienie biznesowe (Business Understanding)

◦ Zrozumienie danych (Data Understanding)

◦ Przygotowanie danych (Data Preparation)

◦ Modelowanie (Modeling)

◦ Ewaluacja (Evaluation)

◦ Wdrożenie (Deployment)

• Zastosowanie CRISP-DM w praktycznych projektach analitycznych

• Iteracyjność procesu – powroty między fazami

1.3. Sztuczna inteligencja w analizie danych

• Podstawowe pojęcia z zakresu AI – generatywna AI i jej zastosowania. Duży model językowy oraz agent AI.

• Zarządzanie kontekstem i konwersacją. Rola pamięci agenta AI w analizie danych.

• Narzędzia wykorzystywane przez agentów AI w analizie danych – generowanie kodu, przeszukiwanie internetu.

• Dostosowywanie agentów AI do własnych potrzeb – personalizacja, umiejętności (skills).

• Bezpieczeństwo i prywatność danych.

• Praktyczna analiza danych z użyciem agenta AI – wprowadzanie danych do kontekstu, konwersacja, praca z treścią generowaną przez agenta AI.

1.4. Sztuczna inteligencja w organizacji procesu analizy

• Wykorzystanie narzędzi AI (np. ChatGPT, Copilot) do planowania projektów analitycznych

• Automatyzacja dokumentowania procesów analizy za pomocą AI

• AI jako wsparcie w definiowaniu pytań biznesowych i hipotez

Moduł 2. Pozyskiwanie i przekształcanie danych

2.1. Formy magazynowania danych

• Pliki płaskie: CSV, TXT, JSON, XML – charakterystyka, wady i zalety

• Arkusze kalkulacyjne jako źródło danych

• Relacyjne bazy danych – zasady działania

• Hurtownie danych i koncepcja Data Warehouse

• Jeziora danych (Data Lake) – wprowadzenie

• Chmurowe źródła danych – przegląd rozwiązań

• Interfejsy API jako źródło danych

2.2. Power Query – pobieranie i przekształcanie danych

2.2.1. Power Query w Excel

• Łączenie z różnymi źródłami danych (pliki, bazy danych, usługi online)

• Edytor Power Query – interfejs i podstawowe operacje

• Czyszczenie danych: usuwanie duplikatów, obsługa braków, zmiana typów

• Przekształcenia kolumn: podział, scalanie, wyodrębnianie wartości

• Filtrowanie i sortowanie danych

• Operacje na tabelach: dopisywanie (Append), scalanie (Merge)

• Grupowanie i agregacja danych

• Tworzenie kolumn niestandardowych i warunkowych

• Parametryzacja zapytań

• Język M – podstawy składni i zastosowania

2.2.2. Power Query w Power BI

• Różnice i rozszerzenia w stosunku do Power Query w Excel

• Pobieranie danych z usług chmurowych i baz danych

• Zaawansowane transformacje danych

• Profilowanie danych – analiza jakości źródła

• Zarządzanie zapytaniami i optymalizacja wydajności

• Tworzenie funkcji w języku M

2.3. Język SQL i relacyjne bazy danych

2.3.1. Podstawy SQL Server

• Architektura SQL Server – instancje, bazy danych, schematy

• SQL Server Management Studio (SSMS) – nawigacja i konfiguracja

• Tworzenie baz danych i tabel

• Typy danych w SQL Server

• Klucze główne, obce, indeksy

2.3.2. Zapytania SQL

• Instrukcja SELECT – pobieranie danych, filtrowanie (WHERE), sortowanie (ORDER BY)

• Funkcje agregujące: COUNT, SUM, AVG, MIN, MAX

• Grupowanie danych: GROUP BY, HAVING

• Złączenia tabel: INNER JOIN, LEFT JOIN, RIGHT JOIN, FULL JOIN, CROSS JOIN

• Podzapytania (subqueries) i wyrażenia CTE (Common Table Expressions)

• Funkcje okna (Window Functions): ROW_NUMBER, RANK, DENSE_RANK, LAG, LEAD, SUM OVER

• Operacje na typach danych: daty, łańcuchy znaków, konwersje

• Instrukcje DML: INSERT, UPDATE, DELETE

• Tworzenie widoków (Views)

• Procedury składowane – podstawy tworzenia i wywoływania

• Wprowadzenie do problematyki optymalizacji zapytań – plany wykonania, indeksy

2.3.3. SQL a Power Query / Power BI

• Importowanie danych z SQL Server do Power Query i Power BI

• Tryb DirectQuery vs Import – kiedy stosować

• Pisanie natywnych zapytań SQL w Power BI

2.4. Sztuczna inteligencja w pozyskiwaniu i przekształcaniu danych

• Wykorzystanie AI do automatycznego rozpoznawania struktury danych

• Generowanie zapytań SQL i formuł M za pomocą narzędzi AI

• AI w procesie czyszczenia i uzupełniania brakujących danych

• Copilot w Excel / Power BI – automatyzacja przygotowania danych

Moduł 3. Tworzenie modeli danych

3.1. Modelowanie danych w Excel (Power Pivot)

• Wprowadzenie do Power Pivot – włączenie dodatku, interfejs

• Importowanie danych z różnych źródeł do modelu danych

• Tworzenie relacji między tabelami

• Model gwiazdy (Star Schema) i model płatka śniegu (Snowflake Schema)

• Wprowadzenie do języka DAX:

◦ Miary (Measures) vs kolumny obliczeniowe (Calculated Columns)

◦ Funkcje podstawowe: SUM, AVERAGE, COUNT, DISTINCTCOUNT

◦ Funkcje kontekstowe: CALCULATE, FILTER, ALL, ALLEXCEPT

◦ Funkcje inteligencji czasowej: TOTALYTD, SAMEPERIODLASTYEAR, DATEADD

◦ Funkcje iteracyjne: SUMX, AVERAGEX, RANKX

• Hierarchie i tabele dat (Date Tables)

• KPI – kluczowe wskaźniki efektywności w modelu danych

3.2. Modelowanie danych w Power BI

• Tworzenie i zarządzanie relacjami w Power BI Desktop

• Konfiguracja kierunkowości filtrowania (Single vs Bi-directional)

• Role Level Security (RLS) – bezpieczeństwo na poziomie wierszy

• Zaawansowane miary DAX w Power BI:

◦ Zmienne (VAR / RETURN)

◦ Tabele wirtualne (SUMMARIZE, ADDCOLUMNS, CROSSJOIN)

◦ Obsługa relacji wiele-do-wielu

◦ Grupy obliczeń (Calculation Groups) – wprowadzenie

◦ Obliczenia wizualne

• Optymalizacja modelu danych pod kątem wydajności oraz rozmiaru

• Najlepsze praktyki w projektowaniu modeli semantycznych

• Modelowanie typowych scenariuszy biznesowych

3.3. Zaawansowane funkcje pracy z danymi w Excel

• Funkcje wyszukiwania: XLOOKUP, INDEX/MATCH, VLOOKUP

• Funkcje tablicowe i dynamiczne tablice: FILTER, SORT, UNIQUE, SEQUENCE

• Funkcje tekstowe i daty w zaawansowanych scenariuszach

• Funkcja LET – zmienne w formułach

• Funkcja LAMBDA – tworzenie własnych funkcji wielokrotnego użytku

• Zaawansowana walidacja danych

• Tabele strukturalne i odwołania strukturalne

• Połączenie Excela z zewnętrznymi źródłami danych

3.4. Sztuczna inteligencja w modelowaniu danych

• Wykorzystanie AI do sugerowania optymalnej struktury modelu danych

• Generowanie formuł DAX za pomocą Copilot i narzędzi AI

• Diagnostyka i wykrywanie problemów w strukturze modelu z użyciem agenta AI

• Wykorzystanie agentów AI oraz dedykowanych AI funkcji arkuszowych w Excel (COPILOT, LABS.GENERATIVEAI)

Moduł 4. Analiza i wizualizacja danych w Excel

4.1. Tabele przestawne (Pivot Tables)

• Tworzenie i konfiguracja tabel przestawnych

• Grupowanie danych w tabelach przestawnych

• Pola obliczeniowe i elementy obliczeniowe

• Fragmentatory (Slicers) i osie czasu (Timelines)

• Połączenie tabel przestawnych z modelem danych Power Pivot

• Tabele przestawne oparte na miarach DAX

4.2. Wizualizacja danych w Excel

• Zasady skutecznej wizualizacji danych

• Wykresy standardowe: kolumnowe, liniowe, kołowe, punktowe

• Wykresy zaawansowane: waterfall, combo, histogram, box plot

• Wykresy przestawne (Pivot Charts)

• Sparklines – mikrowykresy w komórkach

• Formatowanie warunkowe jako narzędzie wizualizacji

• Tworzenie interaktywnych dashboardów w Excel

• Mapy 3D (Power Map) – wizualizacja danych geograficznych

4.3. Analiza statystyczna w Excel

• Statystyki opisowe: średnia, mediana, odchylenie standardowe, percentyle

• Dodatek Analysis ToolPak – przegląd narzędzi

• Analiza korelacji i regresji

• Analiza scenariuszy: Solver, tabele danych, menedżer scenariuszy

• Prognozowanie z wykorzystaniem wbudowanych funkcji (FORECAST)

4.4. Sztuczna inteligencja w analizie danych w Excel

• Funkcje AI w Excel: XLOOKUP z inteligentnymi sugestiami

• Copilot w Excel – automatyczne generowanie formuł, wykresów i analiz

• Analiza danych z użyciem funkcji IDEAS (Analyze Data)

• Generowanie podsumowań i insightów przez AI

• Automatyczne wykrywanie trendów i anomalii

Moduł 5. Analiza i wizualizacja danych w Power BI

5.1. Interfejs i struktura Power BI Desktop

• Widoki: raport, dane, model

• Obszar filtrów, panele wizualizacji i pól

• Zarządzanie stronami raportu

5.2. Tworzenie wizualizacji w Power BI

• Wizualizacje standardowe: wykresy kolumnowe, liniowe, kołowe, mapowe

• Wizualizacje zaawansowane: Treemap, Funnel, Waterfall, Ribbon, Decomposition Tree

• Tabele i macierze – formatowanie warunkowe, paski danych

• Obliczenia wizualne – formuły DAX na poziomie wizualizacji

• Karty (Cards) i wskaźniki KPI

• Wizualizacje niestandardowe z AppSource

• Tooltips – niestandardowe podpowiedzi

• Drillthrough i drilldown – nawigacja w danych

• Zakładki (Bookmarks) i przyciski nawigacyjne

5.3. Interaktywność i zaawansowane funkcje raportów

• Fragmentatory i filtry – konfiguracja i synchronizacja

• Interakcje między wizualizacjami (Edit Interactions)

• Parametry What-if i dynamiczne miary

• Grupy obliczeń – dynamiczne przełączanie miar

• Row-Level Security – konfiguracja i testowanie

• Tworzenie kompletnych dashboardów analitycznych

• Dobre praktyki projektowania raportów (UX/UI)

5.4. Publikowanie i udostępnianie raportów

• Power BI Service – publikowanie raportów w chmurze

• Obszary robocze (Workspaces) i aplikacje

• Odświeżanie danych – harmonogramy, bramy danych (Gateway)

• Udostępnianie raportów i dashboardów

• Eksport danych i raportów

5.5. Sztuczna inteligencja w Power BI

• Key Influencers – automatyczna analiza czynników wpływających

• Decomposition Tree – interaktywna analiza przyczynowo-skutkowa

• Smart Narratives – automatyczne generowanie opisów tekstowych

• Anomaly Detection – wykrywanie odchyleń w danych szeregów czasowych

• Copilot w Power BI – tworzenie raportów i miar za pomocą języka naturalnego

• Automatyczne generowanie insightów (Quick Insights)

Moduł 6. Język Python w analizie i wizualizacji danych

6.1. Podstawy języka Python

• Konfiguracja środowiska: Python, Jupyter Notebook, VS Code

• Wykorzystanie Google Colaboratory

• Typy danych, zmienne, operatory

• Struktury danych: listy, krotki, słowniki, zbiory

• Instrukcje warunkowe i pętle

• Funkcje – definiowanie, argumenty, wartości domyślne

• Praca z plikami (odczyt, zapis)

6.2. Python w analizie danych – biblioteki

6.2.1. NumPy

• Tablice wielowymiarowe (ndarray)

• Operacje matematyczne i statystyczne na tablicach

• Indeksowanie, wycinanie, filtrowanie

6.2.2. Pandas

• DataFrame i Series – tworzenie, indeksowanie, selekcja danych

• Importowanie danych: CSV, Excel, JSON, SQL

• Czyszczenie danych: brakujące wartości, duplikaty, typy danych

• Transformacje: merge, join, concat, pivot, melt, stack/unstack

• Grupowanie i agregacja (groupby)

• Funkcje okna (rolling, expanding, shift)

• Praca z seriami czasowymi (datetime, resample)

• Optymalizacja pamięci i wydajności

6.2.3. Połączenie Pythona z SQL Server

• Biblioteki: pyodbc, sqlalchemy

• Wykonywanie zapytań SQL z poziomu Pythona

• Zapisywanie wyników do bazy danych

• Automatyzacja raportowania z bazy danych

6.3. Wizualizacja danych w Pythonie

6.3.1. Matplotlib

• Tworzenie wykresów: liniowe, słupkowe, kołowe, punktowe

• Formatowanie: tytuły, osie, legendy, adnotacje

• Subplots – wiele wykresów na jednym rysunku

• Eksport wykresów do plików

6.3.2. Seaborn

• Wykresy statystyczne: heatmap, pairplot, boxplot, violinplot

• Wizualizacja rozkładów i korelacji

• Stylizacja i palety kolorów

6.3.3. Plotly

• Interaktywne wizualizacje

• Wykresy 3D i mapy

• Dashboardy z użyciem Plotly Dash – wprowadzenie

6.4. Analiza dużych zbiorów danych z wykorzystaniem Apache Spark

• Wprowadzenie do Big Data i Apache Spark

• Architektura Spark: Driver, Executor, Cluster Manager

• PySpark – konfiguracja i podstawy

• Spark DataFrames – tworzenie, transformacje, akcje

• Spark SQL – zapytania na dużych zbiorach danych

• Przetwarzanie danych w trybie wsadowym i strumieniowym

• Integracja PySpark z Pandas

6.5. Uczenie maszynowe w analizie danych

6.5.1. Podstawy uczenia maszynowego

• Uczenie nadzorowane vs nienadzorowane

• Rodzaje algorytmów: klasyfikacja, regresja, grupowanie, reguły asocjacyjne

• Podział danych: zbiór treningowy, walidacyjny, testowy

• Metryki oceny modeli: accuracy, precision, recall, F1-score, RMSE, MAE, R2

• Przeuczenie (overfitting) i niedouczenie (underfitting)

• Walidacja krzyżowa (Cross-Validation)

• Inżynieria cech: kodowanie zmiennych, skalowanie, selekcja cech

6.5.2. Algorytmy klasyfikacji i regresji

• Regresja liniowa i logistyczna

• Drzewa decyzyjne i lasy losowe (Random Forest)

• K-najbliższych sąsiadów (KNN)

• Support Vector Machines (SVM) – wprowadzenie

• Gradient Boosting: XGBoost, LightGBM – wprowadzenie

6.5.3. Algorytmy grupowania i redukcji wymiarów

• K-Means – grupowanie danych

• DBSCAN

• Analiza skupień hierarchicznych

• PCA (Principal Component Analysis) – redukcja wymiarów

6.5.4. Biblioteka scikit-learn – funkcje zaawansowane

• Pipeline – budowanie potoków przetwarzania

• Strojenie hiperparametrów (GridSearchCV, RandomizedSearchCV)

• Interpretacja modeli: Feature Importance, SHAP – wprowadzenie

6.6. Sztuczna inteligencja w analizie danych z użyciem języka Python

• Przetwarzanie języka naturalnego (NLP) – podstawy:

◦ Tokenizacja i wektoryzacja tekstu

◦ Embedding

◦ Analiza sentymentu z użyciem gotowych modeli

• Wykorzystanie API modeli językowych (OpenAI, Anthropic) w analizie danych

• Automatyzacja analizy danych z użyciem AI:

◦ Generowanie kodu analitycznego przez modele językowe

◦ Automatyczne podsumowywanie wyników analizy

◦ Wsparcie eksploracyjnej analizy danych (EDA) przez narzędzia AI

◦ Wykorzystanie kodu generowanego przez AI w analizie danych wrażliwych

• Generatywna AI w tworzeniu raportów i prezentacji wyników

• Odpowiedzialne stosowanie AI – bias, interpretowalność, etyka

Moduł 7. Wdrażanie analizy danych w przedsiębiorstwie

7.1. Proces wdrożenia projektów analitycznych

• Od prototypu do produkcji – ścieżka wdrożenia

• Definiowanie wymagań biznesowych i KPI

• Komunikowanie wyników analizy interesariuszom

• Storytelling z danymi – budowanie narracji analitycznej

• Dokumentacja projektu analitycznego

7.2. Ewaluacja wyników analizy

• Metody oceny jakości analizy

• Walidacja wyników z ekspertami domenowymi

• Testowanie A/B – zasady i zastosowania

• Monitorowanie modeli w produkcji

• Cykl życia modelu analitycznego

7.3. Zarządzanie danymi w organizacji (przegląd)

• Data Governance – zasady zarządzania danymi

• Jakość danych – wymiary i metryki

• RODO/GDPR – ochrona danych osobowych w kontekście analityki

• Bezpieczeństwo danych i kontrola dostępu

7.4. Sztuczna inteligencja we wdrażaniu analityki

• AI w automatyzacji raportowania i dystrybucji wyników

• Chatboty analityczne – konwersacyjny dostęp do danych

• Integracja narzędzi AI z istniejącą infrastrukturą danych

• Trendy i kierunki rozwoju AI w analizie danych

• Budowanie kultury data-driven z wykorzystaniem AI

Moduł 8. Konsultacje z doradcą HR

8.1. Rozwój kariery analityka danych

• Profil kompetencyjny analityka danych

• Ścieżki kariery: Data Analyst, BI Analyst, Data Scientist, Data Engineer

• Przygotowanie CV i portfolio projektów analitycznych

• Rozmowa kwalifikacyjna – typowe pytania i zadania rekrutacyjne

• Certyfikacje branżowe: Microsoft, Google, Tableau

• Budowanie marki osobistej i networking w branży danych

POBIERZ PROGRAM W PDF

W ramach szkolenia zapewniamy

materiały szkoleniowe
certyfikat potwierdzający udział w kursie
pełna obsługa cateringowa (dla szkoleń stacjonarnych)

Comarch Bootcamp – Analiza danych dla analityków

Comarch Bootcamp – Analiza danych dla analityków

208 godzin, szkolenie analityczne - od podstaw do AI

Zostań analitykiem z Bootcamp – analiza danych!

Poznaj program szkolenia

Dlaczego warto wybrać Comarch Bootcamp?