Uniwersytet Warszawski - Centralny System Uwierzytelniania
Strona główna

Big Data Analytics

Informacje ogólne

Kod przedmiotu: 2400-DS2BDA
Kod Erasmus / ISCED: 14.3 Kod klasyfikacyjny przedmiotu składa się z trzech do pięciu cyfr, przy czym trzy pierwsze oznaczają klasyfikację dziedziny wg. Listy kodów dziedzin obowiązującej w programie Socrates/Erasmus, czwarta (dotąd na ogół 0) – ewentualne uszczegółowienie informacji o dyscyplinie, piąta – stopień zaawansowania przedmiotu ustalony na podstawie roku studiów, dla którego przedmiot jest przeznaczony. / (0311) Ekonomia Kod ISCED - Międzynarodowa Standardowa Klasyfikacja Kształcenia (International Standard Classification of Education) została opracowana przez UNESCO.
Nazwa przedmiotu: Big Data Analytics
Jednostka: Wydział Nauk Ekonomicznych
Grupy: Anglojęzyczna oferta zajęć WNE UW
Przedmioty kierunkowe do wyboru - studia II stopnia IE - grupa 1 (6*30h)
Przedmioty obowiązkowe dla II roku Data Science and Business Analytics
Punkty ECTS i inne: 2.00 Podstawowe informacje o zasadach przyporządkowania punktów ECTS:
  • roczny wymiar godzinowy nakładu pracy studenta konieczny do osiągnięcia zakładanych efektów uczenia się dla danego etapu studiów wynosi 1500-1800 h, co odpowiada 60 ECTS;
  • tygodniowy wymiar godzinowy nakładu pracy studenta wynosi 45 h;
  • 1 punkt ECTS odpowiada 25-30 godzinom pracy studenta potrzebnej do osiągnięcia zakładanych efektów uczenia się;
  • tygodniowy nakład pracy studenta konieczny do osiągnięcia zakładanych efektów uczenia się pozwala uzyskać 1,5 ECTS;
  • nakład pracy potrzebny do zaliczenia przedmiotu, któremu przypisano 3 ECTS, stanowi 10% semestralnego obciążenia studenta.
Język prowadzenia: angielski
Rodzaj przedmiotu:

obowiązkowe

Skrócony opis:

Laboratorium ma na celu zapoznanie Studentów z praktyczną stroną przetwarzania dużych zbiorów danych w środowisku Apache Hadoop. Studenci dowiedzą się jak zastosować techniki analizy danych i uczenia maszynowego poznane na wcześniejszych etapach kształcenia do dużych zbiorów danych. W szczególności kurs nie będzie uczył nowych technik. Zajęcia skupią się na rzeczywistych przykładach i zrozumieniu działania używanych narzędzi.

Pełny opis:

1. Wprowadzenie do środowiska Linux

2. Wprowadzenie do Big Data

• Środowisko Hadoop

• Paradygmat MapReduce

3. Przetwarzanie i eksploracja danych z użyciem Apache Hive i Apache Spark

• Różnice vs. RDBMs

• Optymalizacja

• Pułapki

4. Wprowadzenie do uczenia maszynowego z użyciem Apache Spark

• Przeniesienie modelu zbudowanego w R lub Python na wcześniejszych etapach kształcenia do świata dużych danych (możliwości i ograniczenia)

5. Analiza interaktywna

6. Wizualizacje w Big Data

7. Automatyzacja przetwarzania danych z użyciem Apache Ariflow

Literatura:

Literatura oraz publikacje dostępne on-line będą udostęniane w trakcie laboratorium

Efekty uczenia się:

Studenci nauczą się w jaki sposób wykorzystywać ekosystem Hadoop do przygotowania i analizy dużych zbiorów danych oraz zastosowania podstawowych metod uczenia maszynowego.

K_U02, K_U05

Metody i kryteria oceniania:

Warunkiem zaliczenia przedmiotu jest:

• Obecność na zajęciach

• Prezentacja, w której przedstawione zostaną wybrane zastosowania omówionych w trakcie zajęć metod

• projekt z użyciem dużego zbioru danych

Zajęcia w cyklu "Semestr zimowy 2023/24" (zakończony)

Okres: 2023-10-01 - 2024-01-28
Wybrany podział planu:
Przejdź do planu
Typ zajęć:
Laboratorium, 15 godzin więcej informacji
Koordynatorzy: Michał Bryś
Prowadzący grup: Michał Bryś
Lista studentów: (nie masz dostępu)
Zaliczenie: Przedmiot - Zaliczenie na ocenę
Laboratorium - Zaliczenie na ocenę
Opisy przedmiotów w USOS i USOSweb są chronione prawem autorskim.
Właścicielem praw autorskich jest Uniwersytet Warszawski.
ul. Banacha 2
02-097 Warszawa
tel: +48 22 55 44 214 https://www.mimuw.edu.pl/
kontakt deklaracja dostępności USOSweb 7.0.3.0-2b06adb1e (2024-03-27)