Statistics and Exploratory Data Analysis
Informacje ogólne
Kod przedmiotu: | 2400-DS1ST |
Kod Erasmus / ISCED: |
14.3
|
Nazwa przedmiotu: | Statistics and Exploratory Data Analysis |
Jednostka: | Wydział Nauk Ekonomicznych |
Grupy: |
Anglojęzyczna oferta zajęć WNE UW Przedmioty kierunkowe do wyboru - studia II stopnia IE - grupa 1 (6*30h) Przedmioty obowiązkowe dla I roku Data Science and Business Analytics |
Punkty ECTS i inne: |
5.00
|
Język prowadzenia: | angielski |
Rodzaj przedmiotu: | obowiązkowe |
Skrócony opis: |
Laboratorium ma na celu zapoznanie Studentów z podstawami statystycznej analizy danych. W trakcie kursu Studenci zapoznają się zarówno z podstawowymi koncepcjami teoretycznymi, jak i z narzędziami pozwalającymi na samodzielną eksplorację danych. Każdy z tematów poruszanych w trakcie kursu, zilustrowany będzie za pomocą przykładów oraz zadań do samodzielnego rozwiązania przez Studentów. Uczestnictwo w kursie jest obligatoryjne dla Studentów kierunku Data Science. |
Pełny opis: |
Lista zagadnień omawianych podczas laboratorium obejmuje: Statystyki opisowe: 1. Pojęcie zmiennej losowej, rozkład zmiennej losowej, funkcja gęstości, dystrybuanta 2. Miary położenia rozkładu: średnia, moda (dominanta), mediana, trimean, mid-mean, średnia obcięta, średnia winsorowska, kwartyle, decyle, percentyle 3. Miary rozproszenia rozkładu: rozstęp, wariancja, odchylenie standardowe, rozstęp międzykwartylowy, średnie odchylenie bezwzględne 4. Wyższe momenty rozkładu: współczynnik asymetrii, kurtoza 5. Obserwacje odstające: podejście IQR, Z-score, zmodyfikowany Z-score 6. Estymacja parametrów rozkładu zmiennej losowej (rozkład normalny, rozkład Gamma, rozkład Beta, rozkład log-normalny, rozkład Pareto, etc.) Analiza graficzna: 1. Histogram 2. Estymacja funkcji gęstości (Kernel density) 3. Wykres punktowy 4. Wykres pudełkowy 5. Wykres QQ, wykres PP 6. Wykres przebiegu i inne Wnioskowanie statystyczne 1. Testy jednostronne (test t, test z, test dwumianowy, test Chi-kwadrat) 2. Testy dla dwóch prób niezależnych (test t, test Wilcoxona, test Chi-kwadrat, test Fischera) 3. Testy dla więcej niż dwóch prób niezależnych (ANOVA, Kruskal-Wallis, test Chi-kwadrat) 4. Testy dla dwóch prób zależnych (test t dla prób zależnych, test Wilcoxona dla prób zależnych, test McNemara/test symetrii) 5. Testy dla więcej niż dwóch prób zależnych (ANOVA dla prób zależnych/model efektów mieszanych, test Q-Cochran’a/test Friedmana) Miary zależności 1. Współczynniki korelacji Pearson’a, Spearman’a i Kendalla 2. Współczynnik V-Cramera Moc testów i wielkość próby 1. Podstawowe testy 2. Procedury testowania wielu hipotez. |
Literatura: |
Peng R. D., Exploratory data analysis with R, 2016. Magnificio S. S., Summary and analysis of extension education program evaluation in R, 2016. Wagenmakers E.-J. & Gronau Q. F., A compendium of clean graphs in R, online access. Delignette-Muller M. & Dutang C., Fitdistrplus: an R Package for fitting distributions. Journal of Statistical Software, 64(4) 2015 Blomberg S. P., Power analysis using R, 2014. Delorme P., De Micheaux, P. L., Liquet B., and Riou, J. Type-II generalized family-wise error rate formulas with application to sample size determination. Statist. Med. 2016. |
Efekty uczenia się: |
Studenci nauczą się w jaki sposób obliczyć i interpretować statystyki opisowe oraz wykresy zmiennych losowych, a także przeprowadzić wstępną analizę danych wraz z testowaniem oraz weryfikacją hipotez dotyczących rozkładu zmiennych. Efektem końcowym kursu jest umiejętność przeprowadzenia analizy statystycznej wraz z interpretacją otrzymanych wyników. K_W01, K_U01, K_U02, K_U03, K_U04, K_U05, KS_01 |
Metody i kryteria oceniania: |
Warunkiem zaliczenia przedmiotu jest: • Obecność na zajęciach • Zaliczenie egzaminu pisemnego w formie „open-book” |
Zajęcia w cyklu "Semestr zimowy 2023/24" (w trakcie)
Okres: | 2023-10-01 - 2024-01-28 |
Przejdź do planu
PN WT LAB
LAB
LAB
LAB
ŚR CZ PT |
Typ zajęć: |
Laboratorium, 30 godzin
|
|
Koordynatorzy: | Marcin Chlebus | |
Prowadzący grup: | Marcin Chlebus, Jan Lisicki, Mudassira Sarfraz | |
Lista studentów: | (nie masz dostępu) | |
Zaliczenie: |
Przedmiot -
Zaliczenie na ocenę
Laboratorium - Zaliczenie na ocenę |
Właścicielem praw autorskich jest Uniwersytet Warszawski.