Uniwersytet Warszawski - Centralny System Uwierzytelniania
Strona główna

Analiza i wizualizacja danych

Informacje ogólne

Kod przedmiotu: 1000-719DAV
Kod Erasmus / ISCED: (brak danych) / (brak danych)
Nazwa przedmiotu: Analiza i wizualizacja danych
Jednostka: Wydział Matematyki, Informatyki i Mechaniki
Grupy: Przedmioty kierunkowe na studiach drugiego stopnia na kierunku bioinformatyka
Przedmioty monograficzne dla matematyki 2 stopnia
Punkty ECTS i inne: 6.00 Podstawowe informacje o zasadach przyporządkowania punktów ECTS:
  • roczny wymiar godzinowy nakładu pracy studenta konieczny do osiągnięcia zakładanych efektów uczenia się dla danego etapu studiów wynosi 1500-1800 h, co odpowiada 60 ECTS;
  • tygodniowy wymiar godzinowy nakładu pracy studenta wynosi 45 h;
  • 1 punkt ECTS odpowiada 25-30 godzinom pracy studenta potrzebnej do osiągnięcia zakładanych efektów uczenia się;
  • tygodniowy nakład pracy studenta konieczny do osiągnięcia zakładanych efektów uczenia się pozwala uzyskać 1,5 ECTS;
  • nakład pracy potrzebny do zaliczenia przedmiotu, któremu przypisano 3 ECTS, stanowi 10% semestralnego obciążenia studenta.

zobacz reguły punktacji
Język prowadzenia: angielski
Rodzaj przedmiotu:

obowiązkowe

Skrócony opis:

Poznanie technik analizy i wizualizacji danych w formie statycznej oraz interaktywnej.

Pełny opis:

Uczestnicy kursu będą mogli poznać najpopularniejsze metody analizy i wizualizacji danych jedno-, dwu- lub wielowymiarowych.

Wiedzę teoretyczną zdobytą podczas wykładów będzie można utrwalić na zajęciach laboratoryjnych o charakterze projektowym. Przykłady oraz projekty będą wykonywane z użyciem języka Python.

Uczestnicząc w zajęciach student nauczy się za pomocą języka Python pobrać i przetworzyć dane z najpopularniejszych formatów plików (np. csv, json) i na ich podstawie dokonać interpretacji problemu oraz wizualizacji na odpowiednim wykresie.

Przedmiot składa się z dwóch części:

a) wprowadzenie do programowania w języku Python (jupyter)

b) analiza i wizualizacja danych (część oparta o pakiety takie jak numpy, pandas, scipy, matplotlib, seaborn, plotly, ImageMagick)

• w formie statycznej

• w formie interaktywnej i animowanej

Uczestnicy kursu będą mogli poznać najpopularniejsze metody analizy i wizualizacji danych jedno-, dwu- lub wielowymiarowych.

Wiedzę teoretyczną zdobytą podczas wykładów będzie można utrwalić na zajęciach laboratoryjnych o charakterze projektowym. Przykłady oraz projekty będą wykonywane z użyciem języka Python.

Kolejne wykłady będą dotyczyły następujących tematów:

1) Wprowadzenie do języka Python

2) Jupyter

3) Zbiory danych. Przykłady zbiorów (np. kwartet Anscombe, Iris, MNIST) i ich formatów (csv, json, xml, fastaq)

4) Zbiory danych. Obróbka zbiorów danych za pomocą wbudowanych bibliotek i własnych skryptów (numpy, pandas) .

5) Analiza statystyczna. Średnia arytmetyczna, wariancja, korelacja, regresja liniowa (scipy).

6) Klasyfikacja statystyczna. Drzewa decyzyjne. Metoda wektorów nośnych. Sieci neuronowe.

7) Wizualizacja danych. Przegląd bibliotek do tworzenia wykresów (matplotlib, seaborn, plotly, ImageMagick)

8) Wizualizacja danych. Elementy graficzne (kolory, linie, łuki) i ich zastosowania w prezentacji danych. Transformacje zmiennych i ich wpływ na prezentacje graficzną. Uwzględnienie skali czasu na wykresach. Uwzględnienie współrzędnych przestrzennych na wykresach. Uwzględnienie niepewności (wariancji) na wykresach.

9) Wizualizacja danych. Najczęstsze błędy utrudniające czytanie wykresów. Percepcja kolorów oraz związek z prezentacją danych. Percepcja zależności i danych oraz związek z prezentacją danych.

10) Dobór cech elementu wykresu (długość, pole, kąty, kolory) do zmiennych mierzony zgodnie z różnymi skalami (ilorazowa, różnicowa, uporządkowana, nominalna).

11) Wykresy statyczne i interaktywne

Literatura:

1. Zanurkuj w Pythonie (ebook: https://pl.wikibooks.org/wiki/Zanurkuj_w_Pythonie)

2. Python Data Analysis, Ivan Idris, 2014

3. Python for Data Analysis, Wes MacKinney, 2013

4. Zbiór esejów o sztuce pokazywania danych, P. Biecek, 2014 (http://www.biecek.pl/Eseje/).

strona domowa: https://www.mimuw.edu.pl/~lukaskoz/teaching/dav/

Efekty uczenia się:

Wiedza

1. Ma wiedzę ogólną w zakresie programowania (K_W02).

2. Ma wiedzę na temat konstrukcji programistycznych i składni języka Python (przypisanie, instrukcje sterujące, wywoływanie podprogramów i przekazywanie parametrów) (K_W02).

3. Ma wiedzę na temat struktur danych oraz wykonywanych na nich operacjach (K_W05).

4. Ma wiedzę na temat zarządzania informacją, w tym dotyczącą systemów baz danych, modelowania danych, składowania i wyszukiwania informacji (K_W08).

Umiejętności

1. Potrafi zastosować wiedzę matematyczną do formułowania, analizowania i rozwiązywania związanych z informatyką zadań o średnim poziomie złożoności (K_U01).

2. Potrafi pozyskiwać informacje z literatury, baz wiedzy, Internetu oraz innych wiarygodnych źródeł, integrować je, dokonywać ich interpretacji oraz wyciągać wnioski i formułować opinie (K_U02).

3. Potrafi pisać, uruchamiać i testować programy w wybranym środowisku programistycznym (K_U05).

4. Programuje algorytmy; wykorzystuje podstawowe techniki algorytmiczne i struktury danych (K_U07).

5. Potrafi ocenić, na podstawowym poziomie, przydatność rutynowych metod i narzędzi informatycznych oraz wybrać i zastosować właściwą metodę i narzędzia (K_U22)

6. Zna co najmniej jeden język obcy na poziomie średnio zaawansowanym, oraz język angielski w stopniu umożliwiającym czytanie ze zrozumieniem dokumentacji oprogramowania, podręczników i artykułów informatycznych (K_U30).

Kompetencje

1. Rozumie konieczność systematycznej pracy nad projektami informatycznymi (K_K02).

2. Rozumie i docenia znaczenie uczciwości intelektualnej w działaniach własnych i innych osób; postępuje etycznie (K_K03).

3. Potrafi pracować indywidualnie, w tym także potrafi zarządzać swoim czasem i dotrzymywać terminów (K_K05).

Metody i kryteria oceniania:

Ocena końcowa wyliczana jest na podstawie punktów z projektu i programu zaliczeniowego.

Wagi poszczególnych składników: program - 50%, projekt - 50%.

Do zaliczenia przedmiotu wymagane jest otrzymanie przynajmniej 60% zarowno z programu jak i projektu.

Program: uczestnictwo w wykładach (20% oceny programu) oraz uczestnictwo w ćwiczeniach (80% oceny programu). Każda jednostka wykładowa i ćwiczeniowa skaluje się do odpowiedniej wartości uczestnictwa (np. przy 10 wykładach każdy wykład daje 2% programu czyli 1% oceny koncowej, przy 10 laboratoriach każde laboratorium jest warte 8% programu czyli 4% oceny końcowej). Zaliczenie danego laboratorium podlega ocenie i związane jest z oddaniem rozwiązań wszystkich zadań i pracy domowej (jeśli takowa jest).

Projekt: obejmuje twórcze rozwiązanie problemu na podstawie własnoręcznie przygotowanego zbioru danych i jego odpowiedniej interpretacji zakończonej wizualizacją w formie wykresów. Projekt jest prezentowany zarowno w wersji interaktywnej (HTML) jak i w formie statycznej (PDF).

Zajęcia w cyklu "Semestr letni 2023/24" (w trakcie)

Okres: 2024-02-19 - 2024-06-16
Wybrany podział planu:
Przejdź do planu
Typ zajęć:
Laboratorium, 30 godzin więcej informacji
Wykład, 30 godzin więcej informacji
Koordynatorzy: Łukasz Kozłowski
Prowadzący grup: Łukasz Kozłowski
Lista studentów: (nie masz dostępu)
Zaliczenie: Egzamin
Opisy przedmiotów w USOS i USOSweb są chronione prawem autorskim.
Właścicielem praw autorskich jest Uniwersytet Warszawski.
ul. Banacha 2
02-097 Warszawa
tel: +48 22 55 44 214 https://www.mimuw.edu.pl/
kontakt deklaracja dostępności USOSweb 7.0.2.0-80474ed05 (2024-03-12)