Moduł 1. Organizacja i przebieg procesu analizy danych
1.1. Wprowadzenie do analizy danych
• Czym jest analiza danych – definicja, cele, znaczenie biznesowe
• Rola analityka danych w organizacji
• Rodzaje analiz: opisowa, diagnostyczna, predykcyjna, preskrypcyjna
• Przegląd narzędzi analitycznych stosowanych w kursie
• Etyka i odpowiedzialność w pracy z danymi
1.2. Metodyka CRISP-DM
• Omówienie faz metodyki CRISP-DM:
◦ Zrozumienie biznesowe (Business Understanding)
◦ Zrozumienie danych (Data Understanding)
◦ Przygotowanie danych (Data Preparation)
◦ Modelowanie (Modeling)
◦ Ewaluacja (Evaluation)
◦ Wdrożenie (Deployment)
• Zastosowanie CRISP-DM w praktycznych projektach analitycznych
• Iteracyjność procesu – powroty między fazami
1.3. Sztuczna inteligencja w analizie danych
• Podstawowe pojęcia z zakresu AI – generatywna AI i jej zastosowania. Duży model językowy oraz agent AI.
• Zarządzanie kontekstem i konwersacją. Rola pamięci agenta AI w analizie danych.
• Narzędzia wykorzystywane przez agentów AI w analizie danych – generowanie kodu, przeszukiwanie internetu.
• Dostosowywanie agentów AI do własnych potrzeb – personalizacja, umiejętności (skills).
• Bezpieczeństwo i prywatność danych.
• Praktyczna analiza danych z użyciem agenta AI – wprowadzanie danych do kontekstu, konwersacja, praca z treścią generowaną przez agenta AI.
1.4. Sztuczna inteligencja w organizacji procesu analizy
• Wykorzystanie narzędzi AI (np. ChatGPT, Copilot) do planowania projektów analitycznych
• Automatyzacja dokumentowania procesów analizy za pomocą AI
• AI jako wsparcie w definiowaniu pytań biznesowych i hipotez
Moduł 2. Pozyskiwanie i przekształcanie danych
2.1. Formy magazynowania danych
• Pliki płaskie: CSV, TXT, JSON, XML – charakterystyka, wady i zalety
• Arkusze kalkulacyjne jako źródło danych
• Relacyjne bazy danych – zasady działania
• Hurtownie danych i koncepcja Data Warehouse
• Jeziora danych (Data Lake) – wprowadzenie
• Chmurowe źródła danych – przegląd rozwiązań
• Interfejsy API jako źródło danych
2.2. Power Query – pobieranie i przekształcanie danych
2.2.1. Power Query w Excel
• Łączenie z różnymi źródłami danych (pliki, bazy danych, usługi online)
• Edytor Power Query – interfejs i podstawowe operacje
• Czyszczenie danych: usuwanie duplikatów, obsługa braków, zmiana typów
• Przekształcenia kolumn: podział, scalanie, wyodrębnianie wartości
• Filtrowanie i sortowanie danych
• Operacje na tabelach: dopisywanie (Append), scalanie (Merge)
• Grupowanie i agregacja danych
• Tworzenie kolumn niestandardowych i warunkowych
• Parametryzacja zapytań
• Język M – podstawy składni i zastosowania
2.2.2. Power Query w Power BI
• Różnice i rozszerzenia w stosunku do Power Query w Excel
• Pobieranie danych z usług chmurowych i baz danych
• Zaawansowane transformacje danych
• Profilowanie danych – analiza jakości źródła
• Zarządzanie zapytaniami i optymalizacja wydajności
• Tworzenie funkcji w języku M
2.3. Język SQL i relacyjne bazy danych
2.3.1. Podstawy SQL Server
• Architektura SQL Server – instancje, bazy danych, schematy
• SQL Server Management Studio (SSMS) – nawigacja i konfiguracja
• Tworzenie baz danych i tabel
• Typy danych w SQL Server
• Klucze główne, obce, indeksy
2.3.2. Zapytania SQL
• Instrukcja SELECT – pobieranie danych, filtrowanie (WHERE), sortowanie (ORDER BY)
• Funkcje agregujące: COUNT, SUM, AVG, MIN, MAX
• Grupowanie danych: GROUP BY, HAVING
• Złączenia tabel: INNER JOIN, LEFT JOIN, RIGHT JOIN, FULL JOIN, CROSS JOIN
• Podzapytania (subqueries) i wyrażenia CTE (Common Table Expressions)
• Funkcje okna (Window Functions): ROW_NUMBER, RANK, DENSE_RANK, LAG, LEAD, SUM OVER
• Operacje na typach danych: daty, łańcuchy znaków, konwersje
• Instrukcje DML: INSERT, UPDATE, DELETE
• Tworzenie widoków (Views)
• Procedury składowane – podstawy tworzenia i wywoływania
• Wprowadzenie do problematyki optymalizacji zapytań – plany wykonania, indeksy
2.3.3. SQL a Power Query / Power BI
• Importowanie danych z SQL Server do Power Query i Power BI
• Tryb DirectQuery vs Import – kiedy stosować
• Pisanie natywnych zapytań SQL w Power BI
2.4. Sztuczna inteligencja w pozyskiwaniu i przekształcaniu danych
• Wykorzystanie AI do automatycznego rozpoznawania struktury danych
• Generowanie zapytań SQL i formuł M za pomocą narzędzi AI
• AI w procesie czyszczenia i uzupełniania brakujących danych
• Copilot w Excel / Power BI – automatyzacja przygotowania danych
Moduł 3. Tworzenie modeli danych
3.1. Modelowanie danych w Excel (Power Pivot)
• Wprowadzenie do Power Pivot – włączenie dodatku, interfejs
• Importowanie danych z różnych źródeł do modelu danych
• Tworzenie relacji między tabelami
• Model gwiazdy (Star Schema) i model płatka śniegu (Snowflake Schema)
• Wprowadzenie do języka DAX:
◦ Miary (Measures) vs kolumny obliczeniowe (Calculated Columns)
◦ Funkcje podstawowe: SUM, AVERAGE, COUNT, DISTINCTCOUNT
◦ Funkcje kontekstowe: CALCULATE, FILTER, ALL, ALLEXCEPT
◦ Funkcje inteligencji czasowej: TOTALYTD, SAMEPERIODLASTYEAR, DATEADD
◦ Funkcje iteracyjne: SUMX, AVERAGEX, RANKX
• Hierarchie i tabele dat (Date Tables)
• KPI – kluczowe wskaźniki efektywności w modelu danych
3.2. Modelowanie danych w Power BI
• Tworzenie i zarządzanie relacjami w Power BI Desktop
• Konfiguracja kierunkowości filtrowania (Single vs Bi-directional)
• Role Level Security (RLS) – bezpieczeństwo na poziomie wierszy
• Zaawansowane miary DAX w Power BI:
◦ Zmienne (VAR / RETURN)
◦ Tabele wirtualne (SUMMARIZE, ADDCOLUMNS, CROSSJOIN)
◦ Obsługa relacji wiele-do-wielu
◦ Grupy obliczeń (Calculation Groups) – wprowadzenie
◦ Obliczenia wizualne
• Optymalizacja modelu danych pod kątem wydajności oraz rozmiaru
• Najlepsze praktyki w projektowaniu modeli semantycznych
• Modelowanie typowych scenariuszy biznesowych
3.3. Zaawansowane funkcje pracy z danymi w Excel
• Funkcje wyszukiwania: XLOOKUP, INDEX/MATCH, VLOOKUP
• Funkcje tablicowe i dynamiczne tablice: FILTER, SORT, UNIQUE, SEQUENCE
• Funkcje tekstowe i daty w zaawansowanych scenariuszach
• Funkcja LET – zmienne w formułach
• Funkcja LAMBDA – tworzenie własnych funkcji wielokrotnego użytku
• Zaawansowana walidacja danych
• Tabele strukturalne i odwołania strukturalne
• Połączenie Excela z zewnętrznymi źródłami danych
3.4. Sztuczna inteligencja w modelowaniu danych
• Wykorzystanie AI do sugerowania optymalnej struktury modelu danych
• Generowanie formuł DAX za pomocą Copilot i narzędzi AI
• Diagnostyka i wykrywanie problemów w strukturze modelu z użyciem agenta AI
• Wykorzystanie agentów AI oraz dedykowanych AI funkcji arkuszowych w Excel (COPILOT, LABS.GENERATIVEAI)
Moduł 4. Analiza i wizualizacja danych w Excel
4.1. Tabele przestawne (Pivot Tables)
• Tworzenie i konfiguracja tabel przestawnych
• Grupowanie danych w tabelach przestawnych
• Pola obliczeniowe i elementy obliczeniowe
• Fragmentatory (Slicers) i osie czasu (Timelines)
• Połączenie tabel przestawnych z modelem danych Power Pivot
• Tabele przestawne oparte na miarach DAX
4.2. Wizualizacja danych w Excel
• Zasady skutecznej wizualizacji danych
• Wykresy standardowe: kolumnowe, liniowe, kołowe, punktowe
• Wykresy zaawansowane: waterfall, combo, histogram, box plot
• Wykresy przestawne (Pivot Charts)
• Sparklines – mikrowykresy w komórkach
• Formatowanie warunkowe jako narzędzie wizualizacji
• Tworzenie interaktywnych dashboardów w Excel
• Mapy 3D (Power Map) – wizualizacja danych geograficznych
4.3. Analiza statystyczna w Excel
• Statystyki opisowe: średnia, mediana, odchylenie standardowe, percentyle
• Dodatek Analysis ToolPak – przegląd narzędzi
• Analiza korelacji i regresji
• Analiza scenariuszy: Solver, tabele danych, menedżer scenariuszy
• Prognozowanie z wykorzystaniem wbudowanych funkcji (FORECAST)
4.4. Sztuczna inteligencja w analizie danych w Excel
• Funkcje AI w Excel: XLOOKUP z inteligentnymi sugestiami
• Copilot w Excel – automatyczne generowanie formuł, wykresów i analiz
• Analiza danych z użyciem funkcji IDEAS (Analyze Data)
• Generowanie podsumowań i insightów przez AI
• Automatyczne wykrywanie trendów i anomalii
Moduł 5. Analiza i wizualizacja danych w Power BI
5.1. Interfejs i struktura Power BI Desktop
• Widoki: raport, dane, model
• Obszar filtrów, panele wizualizacji i pól
• Zarządzanie stronami raportu
5.2. Tworzenie wizualizacji w Power BI
• Wizualizacje standardowe: wykresy kolumnowe, liniowe, kołowe, mapowe
• Wizualizacje zaawansowane: Treemap, Funnel, Waterfall, Ribbon, Decomposition Tree
• Tabele i macierze – formatowanie warunkowe, paski danych
• Obliczenia wizualne – formuły DAX na poziomie wizualizacji
• Karty (Cards) i wskaźniki KPI
• Wizualizacje niestandardowe z AppSource
• Tooltips – niestandardowe podpowiedzi
• Drillthrough i drilldown – nawigacja w danych
• Zakładki (Bookmarks) i przyciski nawigacyjne
5.3. Interaktywność i zaawansowane funkcje raportów
• Fragmentatory i filtry – konfiguracja i synchronizacja
• Interakcje między wizualizacjami (Edit Interactions)
• Parametry What-if i dynamiczne miary
• Grupy obliczeń – dynamiczne przełączanie miar
• Row-Level Security – konfiguracja i testowanie
• Tworzenie kompletnych dashboardów analitycznych
• Dobre praktyki projektowania raportów (UX/UI)
5.4. Publikowanie i udostępnianie raportów
• Power BI Service – publikowanie raportów w chmurze
• Obszary robocze (Workspaces) i aplikacje
• Odświeżanie danych – harmonogramy, bramy danych (Gateway)
• Udostępnianie raportów i dashboardów
• Eksport danych i raportów
5.5. Sztuczna inteligencja w Power BI
• Key Influencers – automatyczna analiza czynników wpływających
• Decomposition Tree – interaktywna analiza przyczynowo-skutkowa
• Smart Narratives – automatyczne generowanie opisów tekstowych
• Anomaly Detection – wykrywanie odchyleń w danych szeregów czasowych
• Copilot w Power BI – tworzenie raportów i miar za pomocą języka naturalnego
• Automatyczne generowanie insightów (Quick Insights)
Moduł 6. Język Python w analizie i wizualizacji danych
6.1. Podstawy języka Python
• Konfiguracja środowiska: Python, Jupyter Notebook, VS Code
• Wykorzystanie Google Colaboratory
• Typy danych, zmienne, operatory
• Struktury danych: listy, krotki, słowniki, zbiory
• Instrukcje warunkowe i pętle
• Funkcje – definiowanie, argumenty, wartości domyślne
• Praca z plikami (odczyt, zapis)
6.2. Python w analizie danych – biblioteki
6.2.1. NumPy
• Tablice wielowymiarowe (ndarray)
• Operacje matematyczne i statystyczne na tablicach
• Indeksowanie, wycinanie, filtrowanie
6.2.2. Pandas
• DataFrame i Series – tworzenie, indeksowanie, selekcja danych
• Importowanie danych: CSV, Excel, JSON, SQL
• Czyszczenie danych: brakujące wartości, duplikaty, typy danych
• Transformacje: merge, join, concat, pivot, melt, stack/unstack
• Grupowanie i agregacja (groupby)
• Funkcje okna (rolling, expanding, shift)
• Praca z seriami czasowymi (datetime, resample)
• Optymalizacja pamięci i wydajności
6.2.3. Połączenie Pythona z SQL Server
• Biblioteki: pyodbc, sqlalchemy
• Wykonywanie zapytań SQL z poziomu Pythona
• Zapisywanie wyników do bazy danych
• Automatyzacja raportowania z bazy danych
6.3. Wizualizacja danych w Pythonie
6.3.1. Matplotlib
• Tworzenie wykresów: liniowe, słupkowe, kołowe, punktowe
• Formatowanie: tytuły, osie, legendy, adnotacje
• Subplots – wiele wykresów na jednym rysunku
• Eksport wykresów do plików
6.3.2. Seaborn
• Wykresy statystyczne: heatmap, pairplot, boxplot, violinplot
• Wizualizacja rozkładów i korelacji
• Stylizacja i palety kolorów
6.3.3. Plotly
• Interaktywne wizualizacje
• Wykresy 3D i mapy
• Dashboardy z użyciem Plotly Dash – wprowadzenie
6.4. Analiza dużych zbiorów danych z wykorzystaniem Apache Spark
• Wprowadzenie do Big Data i Apache Spark
• Architektura Spark: Driver, Executor, Cluster Manager
• PySpark – konfiguracja i podstawy
• Spark DataFrames – tworzenie, transformacje, akcje
• Spark SQL – zapytania na dużych zbiorach danych
• Przetwarzanie danych w trybie wsadowym i strumieniowym
• Integracja PySpark z Pandas
6.5. Uczenie maszynowe w analizie danych
6.5.1. Podstawy uczenia maszynowego
• Uczenie nadzorowane vs nienadzorowane
• Rodzaje algorytmów: klasyfikacja, regresja, grupowanie, reguły asocjacyjne
• Podział danych: zbiór treningowy, walidacyjny, testowy
• Metryki oceny modeli: accuracy, precision, recall, F1-score, RMSE, MAE, R2
• Przeuczenie (overfitting) i niedouczenie (underfitting)
• Walidacja krzyżowa (Cross-Validation)
• Inżynieria cech: kodowanie zmiennych, skalowanie, selekcja cech
6.5.2. Algorytmy klasyfikacji i regresji
• Regresja liniowa i logistyczna
• Drzewa decyzyjne i lasy losowe (Random Forest)
• K-najbliższych sąsiadów (KNN)
• Support Vector Machines (SVM) – wprowadzenie
• Gradient Boosting: XGBoost, LightGBM – wprowadzenie
6.5.3. Algorytmy grupowania i redukcji wymiarów
• K-Means – grupowanie danych
• DBSCAN
• Analiza skupień hierarchicznych
• PCA (Principal Component Analysis) – redukcja wymiarów
6.5.4. Biblioteka scikit-learn – funkcje zaawansowane
• Pipeline – budowanie potoków przetwarzania
• Strojenie hiperparametrów (GridSearchCV, RandomizedSearchCV)
• Interpretacja modeli: Feature Importance, SHAP – wprowadzenie
6.6. Sztuczna inteligencja w analizie danych z użyciem języka Python
• Przetwarzanie języka naturalnego (NLP) – podstawy:
◦ Tokenizacja i wektoryzacja tekstu
◦ Embedding
◦ Analiza sentymentu z użyciem gotowych modeli
• Wykorzystanie API modeli językowych (OpenAI, Anthropic) w analizie danych
• Automatyzacja analizy danych z użyciem AI:
◦ Generowanie kodu analitycznego przez modele językowe
◦ Automatyczne podsumowywanie wyników analizy
◦ Wsparcie eksploracyjnej analizy danych (EDA) przez narzędzia AI
◦ Wykorzystanie kodu generowanego przez AI w analizie danych wrażliwych
• Generatywna AI w tworzeniu raportów i prezentacji wyników
• Odpowiedzialne stosowanie AI – bias, interpretowalność, etyka
Moduł 7. Wdrażanie analizy danych w przedsiębiorstwie
7.1. Proces wdrożenia projektów analitycznych
• Od prototypu do produkcji – ścieżka wdrożenia
• Definiowanie wymagań biznesowych i KPI
• Komunikowanie wyników analizy interesariuszom
• Storytelling z danymi – budowanie narracji analitycznej
• Dokumentacja projektu analitycznego
7.2. Ewaluacja wyników analizy
• Metody oceny jakości analizy
• Walidacja wyników z ekspertami domenowymi
• Testowanie A/B – zasady i zastosowania
• Monitorowanie modeli w produkcji
• Cykl życia modelu analitycznego
7.3. Zarządzanie danymi w organizacji (przegląd)
• Data Governance – zasady zarządzania danymi
• Jakość danych – wymiary i metryki
• RODO/GDPR – ochrona danych osobowych w kontekście analityki
• Bezpieczeństwo danych i kontrola dostępu
7.4. Sztuczna inteligencja we wdrażaniu analityki
• AI w automatyzacji raportowania i dystrybucji wyników
• Chatboty analityczne – konwersacyjny dostęp do danych
• Integracja narzędzi AI z istniejącą infrastrukturą danych
• Trendy i kierunki rozwoju AI w analizie danych
• Budowanie kultury data-driven z wykorzystaniem AI
Moduł 8. Konsultacje z doradcą HR
8.1. Rozwój kariery analityka danych
• Profil kompetencyjny analityka danych
• Ścieżki kariery: Data Analyst, BI Analyst, Data Scientist, Data Engineer
• Przygotowanie CV i portfolio projektów analitycznych
• Rozmowa kwalifikacyjna – typowe pytania i zadania rekrutacyjne
• Certyfikacje branżowe: Microsoft, Google, Tableau
• Budowanie marki osobistej i networking w branży danych
POBIERZ PROGRAM W PDF