Moduł A: Organizacja i przebieg procesu analizy danych (2 godz.)
Analiza danych powinna odbywać się w ramach dobrze zorganizowanego i prowadzonego procesu. Pozwala to zwiększyć efektywność, lepiej gospodarować posiadanymi zasobami oraz zmniejszyć ryzyko niepowodzenia.
Metodyka CRISP-DM
Moduł B: Pozyskiwanie danych. Przekształcanie danych. Tworzenie modeli analitycznych (98 godz.)
Celem modułu jest zapoznanie Uczestników z różnymi formami przechowywania danych, które są stosowane w procesach analitycznych. Uczestnicy pozyskają umiejętności pozwalające na dobór odpowiedniej techniki magazynowania i przetwarzania danych, zaprojektowanie, budowę oraz wykorzystanie magazynów danych we własnych rozwiązaniach analitycznych.
Formy magazynowania danych – wady, zalety, korzyści, potencjalne problemy
Microsoft Excel – praca ze zbiorami danych
Relacyjne bazy danych – wykorzystanie języka SQL – Microsoft SQL Server
Tworzenie procesów ładowania i transformacji danych z wykorzystaniem SQL Server Integration Services
Moduł C: Wizualizacja danych, raportowanie, udostępnianie analiz (80 godz.)
Analiza danych z wykorzystaniem arkusza kalkulacyjnego Excel
Analiza i wizualizacja danych z wykorzystaniem Power BI
Język R w analizie danych
Analiza i wizualizacja danych w Tableau
Raportowanie z wykorzystaniem SQL Server Reporting Services
Moduł D: Analiza zaawansowana – uczenie maszynowe (24 godz.)
Podstawy uczenia maszynowego
Tworzenie i wykorzystanie modeli uczenia maszynowego w języku R
Funkcje uczenia maszynowego w Power BI
Moduł E: Konsultacje z doradcą HR (4 godz.)
Konsultacje z doradcą HR
Metoda realizacji szkolenia
W trakcie szkolenia uczestnicy będą realizowali trzy projekty praktyczne:
1. Projekt realizowany w trakcie trwania modułu B.
Celem projektu jest przygotowanie kompletnego modelu analitycznego obejmującego zdefiniowany obszar merytoryczny.
Realizacja projektu będzie wymagała:
- Pozyskania danych z różnorodnych źródeł (bazy danych, dane publiczne w Internecie, pliki płaskie, arkusze Excel).
- Utworzenia zautomatyzowanych procedur pobierania i przekształcania danych.
- Zaprojektowania i realizacji tabelarycznego modelu analitycznego.
- Zdefiniowania w ramach modelu szeregu kalkulacji pozwalających na analizę w różnych perspektywach czasowych.
2. Projekt realizowany w trakcie trwania modułu C.
Celem projektu jest przygotowanie wizualizacji danych na modelu utworzonym w ramach pierwszego projektu. Realizacja projektu będzie wymagała:
- Doboru odpowiednich do celów wizualizacji danych.
- Utworzenia raportów prezentujących analizę danych oraz wnioski z niej płynące.
Utworzenie interaktywnej prezentacji opowiadającej historię zapisaną w modelu (storytelling).
Do realizacji projektu uczestnik będzie mógł wykorzystać Power BI lub SQL Server Reporting Services.
3. Projekt końcowy.
Jest to projekt podsumowujący wiedzę nabytą w trakcie naszego intensywnego kursu analizy danych. Punktem wyjścia będzie zestaw pytań, na które, przy pomocy utworzonego modelu oraz analizy wspartej uczeniem maszynowym, będzie musiał odpowiedzieć uczestnik kursu. Realizacja projektu będzie wymagała:
Pozyskania danych adekwatnych do wymagań projektu.
- Utworzenia modelu analitycznego wraz z zautomatyzowanymi procedurami pobierania i transformacji danych.
- Przeprowadzenia eksploracyjnej analizy danych.
- Wykorzystania algorytmów uczenia maszynowego do budowy modelu, który będzie mógł być użyty w predykcji danych.
- Utworzenia raportów prezentujących wypracowane wnioski.
- Zaprezentowania całości efektów projektu.
POBIERZ PROGRAM W PDF