Uniwersytet Warszawski - Centralny System Uwierzytelniania
Strona główna

Uczenie statystyczne

Informacje ogólne

Kod przedmiotu: 1000-317bSML
Kod Erasmus / ISCED: (brak danych) / (0612) Database and network design and administration Kod ISCED - Międzynarodowa Standardowa Klasyfikacja Kształcenia (International Standard Classification of Education) została opracowana przez UNESCO.
Nazwa przedmiotu: Uczenie statystyczne
Jednostka: Wydział Matematyki, Informatyki i Mechaniki
Grupy: Przedmioty obowiązkowe dla I roku Machine Learning
Punkty ECTS i inne: 6.00 Podstawowe informacje o zasadach przyporządkowania punktów ECTS:
  • roczny wymiar godzinowy nakładu pracy studenta konieczny do osiągnięcia zakładanych efektów uczenia się dla danego etapu studiów wynosi 1500-1800 h, co odpowiada 60 ECTS;
  • tygodniowy wymiar godzinowy nakładu pracy studenta wynosi 45 h;
  • 1 punkt ECTS odpowiada 25-30 godzinom pracy studenta potrzebnej do osiągnięcia zakładanych efektów uczenia się;
  • tygodniowy nakład pracy studenta konieczny do osiągnięcia zakładanych efektów uczenia się pozwala uzyskać 1,5 ECTS;
  • nakład pracy potrzebny do zaliczenia przedmiotu, któremu przypisano 3 ECTS, stanowi 10% semestralnego obciążenia studenta.
Język prowadzenia: angielski
Rodzaj przedmiotu:

monograficzne

Skrócony opis:

Celem przedmiotu jest wprowadzenie podstawowych pojęć i narzędzi statystycznych używanych w uczeniu maszynowym takich jak regresja liniowa, logistyczna i wielowymiarowa, klasyfikatory, metody redukcji wymiaru, metody bayesowskie.

Pełny opis:

Szczegółowy program

  1. Statystyka eksploracyjna (2-3 zajęcia)
    1. Basic summary statistic (wartość średnia, mediana, wariancja próbki, etc.)
    2. Wizualizacja danych (histogram, wykres pudełkowy, estymator jądrowy gęstości)
    3. Analiza głównych składowych
    4. Klasteryzacja, klasteryzacja hierarchiczna, k-średnie, k-medoidy 
  2. Teoria statystyki (4-5 zajęć)
    1. Podstawowe definicje (modele statystyczne, statystyki, wiarygodność, etc.)
    2. Teoria szacowania (estymatory największej wiarygodności, efektywność, błąd średniokwadratowy, kompromis między obciążeniem a wariancją, przedziały ufności)
    3. Testowanie hipotez statystycznych (błędy typu I i II, moc testu, poziom istotności, wartość p)
    4. Problemy związane z wartością p (efekt rozmiaru, testowanie wielu hipotez)
    5. Wnioskowanie bayesowskie (rozkład a priori, rozkład a posteriori, ryzyko bayesowskie i estymator bayesowski, przedziały wiarygodności)
    6. Odległość między miarami prawdopodobieństwa (dywergencja Kullbacka-Leiblera, miara maksymalnej różnicy, etc.)
  3. Proste modele regresyjne i klasyfikacyjne (3-4 zajęć)
    1. Regresja liniowa 
    2. Klasyfikacja. Regresja logistyczna, LDA, QDA
    3. Walidacja krzyżowa i bootstrap
    4. Wybór modelu i regularyzacja, regresja grzbietowa, metoda Lasso, algorytm forward-backward
  4. Modele zaawansowane (3 zajęcia)
    1. Modele drzewiaste, bagging, lasy losowe, boosting
    2. Maszyna wektorów nośnych
    3. Modele nieliniowe: funkcje sklejane, uogólnione modele addytywne
Literatura:

1. Trevor Hastie, Robert Tibshirani, Jerome H., The Elements of Statistical Learning: Data Mining, Inference, and Prediction, Springer, Berlin

2. Andrew Ng, Machine Learning Yearning, https://github.com/ajaymache/machine-learning-yearning

Efekty uczenia się:

Wiedza: student zna i rozumie

* w pogłębionym stopniu - podstawową wiedzę z działów matematyki niezbędnych do studiowania uczenia maszynowego (rachunek prawdopodobieństwa, statystyka, analiza wielowymiarowa, i algebra liniowa) [K_W05];

* w uporządkowany i podbudowany teoretycznie sposób wiedzę w zakresie podstawowych narzędzi statystycznych stosowanych w modelowaniu i analizie danych [K_W07].

Umiejętności: student potrafi

* konstruować rozumowania matematyczne [K_U06];

* wyrażać problemy w języku matematyki [K_U07];

* stosować techniki nowoczesnej statystycznej analizy danych [K_U10].

Kompetencje społeczne: student jest gotów do

* krytycznej oceny posiadanej wiedzy i odbieranych treści [K_K01];

* uznawania znaczenia wiedzy w rozwiązywaniu problemów poznawczych i praktycznych oraz zasięgania opinii ekspertów w przypadku trudności z samodzielnym rozwiązaniem problemu [K_K02];

* myślenia i działania w sposób przedsiębiorczy [K_K03].

Metody i kryteria oceniania:

Wpływ na ocenę końcową: test końcowy (50%), dwa zadania programistyczne na ocenę (50%), aktywność w trakcie labów (10%).

Zajęcia w cyklu "Semestr zimowy 2023/24" (zakończony)

Okres: 2023-10-01 - 2024-01-28
Wybrany podział planu:
Przejdź do planu
Typ zajęć:
Laboratorium, 30 godzin więcej informacji
Wykład, 30 godzin więcej informacji
Koordynatorzy: Dorota Celińska-Kopczyńska
Prowadzący grup: Dorota Celińska-Kopczyńska, Jakub Krajewski, Andrzej Mizera, Grzegorz Preibisch
Lista studentów: (nie masz dostępu)
Zaliczenie: Zaliczenie na ocenę

Zajęcia w cyklu "Semestr zimowy 2024/25" (jeszcze nie rozpoczęty)

Okres: 2024-10-01 - 2025-01-26
Wybrany podział planu:
Przejdź do planu
Typ zajęć:
Laboratorium, 30 godzin więcej informacji
Wykład, 30 godzin więcej informacji
Koordynatorzy: Dorota Celińska-Kopczyńska
Prowadzący grup: Maria Bochenek, Dorota Celińska-Kopczyńska, Andrzej Mizera, Marcin Szczuka
Lista studentów: (nie masz dostępu)
Zaliczenie: Zaliczenie na ocenę
Opisy przedmiotów w USOS i USOSweb są chronione prawem autorskim.
Właścicielem praw autorskich jest Uniwersytet Warszawski.
ul. Banacha 2
02-097 Warszawa
tel: +48 22 55 44 214 https://www.mimuw.edu.pl/
kontakt deklaracja dostępności mapa serwisu USOSweb 7.1.0.0-360daf7b8 (2024-08-28)