Big Data Analytics
Informacje ogólne
Kod przedmiotu: | 2400-DS2BDA |
Kod Erasmus / ISCED: |
14.3
|
Nazwa przedmiotu: | Big Data Analytics |
Jednostka: | Wydział Nauk Ekonomicznych |
Grupy: |
Anglojęzyczna oferta zajęć WNE UW Przedmioty kierunkowe do wyboru - studia II stopnia IE - grupa 1 (6*30h) Przedmioty obowiązkowe dla II roku Data Science and Business Analytics |
Punkty ECTS i inne: |
2.00
|
Język prowadzenia: | angielski |
Rodzaj przedmiotu: | obowiązkowe |
Skrócony opis: |
Laboratorium ma na celu zapoznanie Studentów z praktyczną stroną przetwarzania dużych zbiorów danych w środowisku Apache Hadoop. Studenci dowiedzą się jak zastosować techniki analizy danych i uczenia maszynowego poznane na wcześniejszych etapach kształcenia do dużych zbiorów danych. W szczególności kurs nie będzie uczył nowych technik. Zajęcia skupią się na rzeczywistych przykładach i zrozumieniu działania używanych narzędzi. |
Pełny opis: |
1. Wprowadzenie do środowiska Linux 2. Wprowadzenie do Big Data • Środowisko Hadoop • Paradygmat MapReduce 3. Przetwarzanie i eksploracja danych z użyciem Apache Hive i Apache Spark • Różnice vs. RDBMs • Optymalizacja • Pułapki 4. Wprowadzenie do uczenia maszynowego z użyciem Apache Spark • Przeniesienie modelu zbudowanego w R lub Python na wcześniejszych etapach kształcenia do świata dużych danych (możliwości i ograniczenia) 5. Analiza interaktywna 6. Wizualizacje w Big Data 7. Automatyzacja przetwarzania danych z użyciem Apache Ariflow |
Literatura: |
Literatura oraz publikacje dostępne on-line będą udostęniane w trakcie laboratorium |
Efekty uczenia się: |
Studenci nauczą się w jaki sposób wykorzystywać ekosystem Hadoop do przygotowania i analizy dużych zbiorów danych oraz zastosowania podstawowych metod uczenia maszynowego. K_U02, K_U05 |
Metody i kryteria oceniania: |
Warunkiem zaliczenia przedmiotu jest: • Obecność na zajęciach • Prezentacja, w której przedstawione zostaną wybrane zastosowania omówionych w trakcie zajęć metod • projekt z użyciem dużego zbioru danych |
Zajęcia w cyklu "Semestr zimowy 2023/24" (zakończony)
Okres: | 2023-10-01 - 2024-01-28 |
Przejdź do planu
PN LAB
LAB
WT ŚR LAB
CZ PT |
Typ zajęć: |
Laboratorium, 15 godzin
|
|
Koordynatorzy: | Michał Bryś | |
Prowadzący grup: | Michał Bryś | |
Lista studentów: | (nie masz dostępu) | |
Zaliczenie: |
Przedmiot -
Zaliczenie na ocenę
Laboratorium - Zaliczenie na ocenę |
Zajęcia w cyklu "Semestr zimowy 2024/25" (zakończony)
Okres: | 2024-10-01 - 2025-01-26 |
Przejdź do planu
PN LAB
LAB
WT ŚR LAB
LAB
CZ PT |
Typ zajęć: |
Laboratorium, 15 godzin
|
|
Koordynatorzy: | Piotr Menclewicz | |
Prowadzący grup: | Piotr Menclewicz | |
Lista studentów: | (nie masz dostępu) | |
Zaliczenie: |
Przedmiot -
Zaliczenie na ocenę
Laboratorium - Zaliczenie na ocenę |
Właścicielem praw autorskich jest Uniwersytet Warszawski.