Uniwersytet Warszawski - Centralny System Uwierzytelniania
Strona główna

Laboratorium: analiza danych

Informacje ogólne

Kod przedmiotu: 3800-AIK-LAD
Kod Erasmus / ISCED: (brak danych) / (brak danych)
Nazwa przedmiotu: Laboratorium: analiza danych
Jednostka: Wydział Filozofii
Grupy: Przedmioty obowiązkowe, AIK, studia niestacjonarne, pierwszego stopnia
Punkty ECTS i inne: 6.00 Podstawowe informacje o zasadach przyporządkowania punktów ECTS:
  • roczny wymiar godzinowy nakładu pracy studenta konieczny do osiągnięcia zakładanych efektów uczenia się dla danego etapu studiów wynosi 1500-1800 h, co odpowiada 60 ECTS;
  • tygodniowy wymiar godzinowy nakładu pracy studenta wynosi 45 h;
  • 1 punkt ECTS odpowiada 25-30 godzinom pracy studenta potrzebnej do osiągnięcia zakładanych efektów uczenia się;
  • tygodniowy nakład pracy studenta konieczny do osiągnięcia zakładanych efektów uczenia się pozwala uzyskać 1,5 ECTS;
  • nakład pracy potrzebny do zaliczenia przedmiotu, któremu przypisano 3 ECTS, stanowi 10% semestralnego obciążenia studenta.
Język prowadzenia: polski
Założenia (opisowo):

- podstawowa znajomość struktur danych w Pandas oraz pracy w środowisku Jupyter / podobnym;

- zalecana (choć niekonieczna) znajomość podstaw statystyki z równolegle realizowanego kursu “Statystyka”;

- gotowość do pracy projektowej w małych zespołach i korzystania z systemu kontroli wersji Git/GitHub.

Skrócony opis:

Laboratorium rozwija zaawansowane umiejętności przetwarzania, analizy i wizualizacji danych eksperymentalnych. Studenci pracują z rzeczywistymi zbiorami danych (np. z badań poznawczych lub neuropsychologicznych), realizując pełny cykl pracy z danymi: od importu i czyszczenia danych, przez eksplorację statystyczną i wizualizację danych, po raportowanie wyników. Wykorzystywane są narzędzia Pythona (m.in. Pandas, Seaborn, Matplotlib, SciPy/statsmodels) oraz GitHub do kontroli wersji i współpracy zespołowej. Zajęcia kończą się projektem analizy danych, obejmującym przygotowanie czytelnego raportu i prezentację wyników.

Pełny opis:

Celem laboratorium jest praktyczne opanowanie pełnego cyklu pracy z danymi empirycznymi - od surowych plików po raport badawczy - na przykładach z kognitywistyki i psychologii poznawczej.

Na zajęciach studenci, pracując indywidualnie i w małych zespołach, realizują kolejne etapy:

- pozyskanie i import danych (pliki CSV/Excel, proste bazy SQL, dane z repozytoriów badawczych);

- wstępne rozpoznanie struktury danych, typów zmiennych i potencjalnych problemów (braki, wartości odstające, błędne zakodowanie);

- czyszczenie i transformacja danych w Pandas: filtrowanie, scalanie tabel, przekształcanie zmiennych, tworzenie nowych wskaźników;

- eksploracja danych: statystyki opisowe, rozkłady, korelacje, wstępne modele;

- wizualizacja danych z użyciem Seaborn/Matplotlib (wykresy rozkładów, zależności, interakcji) oraz zasady czytelnej prezentacji;

- zastosowanie podstawowych metod wnioskowania statystycznego poznanych na wykładzie

“Statystyka” do danych eksperymentalnych (testy hipotez, ANOVA, proste modele regresyjne);

- interpretacja wyników w kontekście pytań badawczych i teorii procesów poznawczych;

- dokumentowanie pracy z danymi (notebooki Jupyter, README, komentarze w kodzie);

- korzystanie z systemu kontroli wersji Git oraz platformy GitHub do pracy nad wspólnym repozytorium;

- przygotowanie końcowego raportu z analizy (notebook, raport PDF/HTML, prezentacja ustna).

Podstawą zaliczenia jest projekt analizy danych wzięty z rzeczywistego badania (bądź realistycznie zasymulowany), realizowany od etapu postawienia pytania badawczego po raportowanie i prezentację wyników.

Literatura:

Literatura podstawowa:

- W. McKinney, “Python for Data Analysis”, O’Reilly.

- J. VanderPlas, “Python Data Science Handbook”, O’Reilly.

- A. Downey, “Think Stats. Exploratory Data Analysis in Python”, O’Reilly.

Literatura uzupełniająca:

- C. A. Cullen, “Practical Statistics for Data Scientists”, O’Reilly

- M. Krzywinski, N. Wong, “Fundamentals of Data Visualization” (dostępna także online).

- Dokumentacja bibliotek pandas, matplotlib, seaborn, statsmodels oraz oficjalna dokumentacja Git i GitHuba.

Efekty uczenia się:

Nabyta wiedza:

- zna podstawowe składniki programów komputerowych oraz narzędzia programistyczne wykorzystywane w analizie danych w języku Python (K_W01);

- zna narzędzia statystyczne stosowane w modelowaniu i analizie danych eksperymentalnych, w szczególności danych psychologicznych i neurofizjologicznych (K_W05, K_W08).

Nabyte umiejętności:

- potrafi przygotować dane do analizy: zaimportować je z różnych źródeł, oczyścić, przekształcić i udokumentować zastosowane operacje (K_U05, K_U09);

- potrafi zastosować w Pythonie odpowiednie techniki analizy danych (statystyka opisowa, testy hipotez, proste modele regresyjne) oraz wykonać wizualizacje i interpretację wyników (K_U05, K_U09, K_W05);

- potrafi zaplanować i zrealizować projekt analizy danych, wykorzystując narzędzia kontroli wersji i pracy zespołowej (Git, GitHub), a także zintegrować wiedzę statystyczną z wiedzą z zakresu kognitywistyki i AI (K_U19, K_U20).

Nabyte kompetencje społeczne:

- potrafi precyzyjnie formułować pytania badawcze i techniczne; (K_K02);

- jest przygotowany do pracy zespołowej nad projektem analizy danych, dzielenia się zadaniami i odpowiedzialnością oraz wypracowywania wspólnych standardów pracy (K_K03);

- jest gotów do systematycznej, długofalowej pracy nad projektem badawczym, w tym do iteracyjnego ulepszania kodu, analiz i raportu (K_K04).

Metody i kryteria oceniania:

- podstawą zaliczenia jest projekt (indywidualny lub zespołowy) polegający na przygotowaniu analizy danych, obejmujący pełen cykl pracy z danymi – od przygotowania po raport i prezentację;

- na ocenę składają się:

- jakość i czytelność kodu (struktura projektu, komentowanie, użycie Git/GitHub);

- poprawność przygotowania danych (obsługa braków, transformacje, uzasadnienie decyzji);

- adekwatność zastosowanych metod statystycznych i poprawność ich wykonania;

- jakość wizualizacji i interpretacji wyników;

- końcowy raport (notebook/raport pisemny) oraz krótka prezentacja wyników;

- warunkiem zaliczenia jest terminowe złożenie projektu i obecność na większości zajęć

Dopuszczalna liczba nieobecności podlegających usprawiedliwieniu: 2 nieobecności; każda dodatkowa wymaga odrobienia zajęć w formie samodzielnego opracowania zadań wskazanych przez prowadzącego.

Zajęcia w cyklu "Semestr letni 2025/26" (w trakcie)

Okres: 2026-02-16 - 2026-06-07
Wybrany podział planu:
Przejdź do planu
Typ zajęć:
Ćwiczenia, 60 godzin, 45 miejsc więcej informacji
Koordynatorzy: Artur Czeszumski, Bartosz Maćkiewicz
Prowadzący grup: Artur Czeszumski, Bartosz Maćkiewicz
Lista studentów: (nie masz dostępu)
Zaliczenie: Przedmiot - Zaliczenie na ocenę
Ćwiczenia - Zaliczenie na ocenę
Opisy przedmiotów w USOS i USOSweb są chronione prawem autorskim.
Właścicielem praw autorskich jest Uniwersytet Warszawski.
ul. Banacha 2
02-097 Warszawa
tel: +48 22 55 44 214 https://www.mimuw.edu.pl/
kontakt deklaracja dostępności mapa serwisu USOSweb 7.2.0.0-a85e39876 (2026-03-10)