Uniwersytet Warszawski - Centralny System Uwierzytelniania
Strona główna

Przetwarzanie i analiza danych w języku Python

Informacje ogólne

Kod przedmiotu: 2400-ZEWW779
Kod Erasmus / ISCED: 14.3 Kod klasyfikacyjny przedmiotu składa się z trzech do pięciu cyfr, przy czym trzy pierwsze oznaczają klasyfikację dziedziny wg. Listy kodów dziedzin obowiązującej w programie Socrates/Erasmus, czwarta (dotąd na ogół 0) – ewentualne uszczegółowienie informacji o dyscyplinie, piąta – stopień zaawansowania przedmiotu ustalony na podstawie roku studiów, dla którego przedmiot jest przeznaczony. / (0311) Ekonomia Kod ISCED - Międzynarodowa Standardowa Klasyfikacja Kształcenia (International Standard Classification of Education) została opracowana przez UNESCO.
Nazwa przedmiotu: Przetwarzanie i analiza danych w języku Python
Jednostka: Wydział Nauk Ekonomicznych
Grupy: Przedmioty kierunkowe do wyboru - studia II stopnia EM - grupa 1 (3*30h)
Przedmioty kierunkowe do wyboru - studia II stopnia EM - grupa 2 (1*30h)
Przedmioty kierunkowe do wyboru - studia II stopnia IE - grupa 2 (2*30h)
Przedmioty wyboru kierunkowego dla studiów licencjackich EM
Przedmioty wyboru kierunkowego dla studiów licencjackich IE
Przedmioty wyboru kierunkowego dla studiów licencjackich MSEM
Punkty ECTS i inne: (brak) Podstawowe informacje o zasadach przyporządkowania punktów ECTS:
  • roczny wymiar godzinowy nakładu pracy studenta konieczny do osiągnięcia zakładanych efektów uczenia się dla danego etapu studiów wynosi 1500-1800 h, co odpowiada 60 ECTS;
  • tygodniowy wymiar godzinowy nakładu pracy studenta wynosi 45 h;
  • 1 punkt ECTS odpowiada 25-30 godzinom pracy studenta potrzebnej do osiągnięcia zakładanych efektów uczenia się;
  • tygodniowy nakład pracy studenta konieczny do osiągnięcia zakładanych efektów uczenia się pozwala uzyskać 1,5 ECTS;
  • nakład pracy potrzebny do zaliczenia przedmiotu, któremu przypisano 3 ECTS, stanowi 10% semestralnego obciążenia studenta.

zobacz reguły punktacji
Język prowadzenia: polski
Rodzaj przedmiotu:

nieobowiązkowe

Skrócony opis:

Celem zajęć jest wprowadzenie uczestników do programowania w języku Python, szczególnie w kontekście analizy i wizualizacji danych. W trakcie zajęć przedstawione zostaną odpowiednie narzędzia umożliwiające sprawne przygotowanie i obróbkę danych, a także metody wykorzystywane do analizy ekonomicznej. Dzięki temu każdy z uczestników będzie przygotowany do podjęcia bardziej zaawansowanych kursów programowania w przyszłości. Tempo zajęć i zakres materiału dopasowane zostaną do potrzeb uczestników. Wcześniejsza znajomość języka Python nie jest wymagana do udziału w zajęciach.

Pełny opis:

1. Wprowadzenie do programowania obiektowego. Instalacja środowiska, zapoznanie z Ipython Notebook. (1.5 h)

2. Struktury danych (string, lista, krotka, słownik, zbiór, data-frame) (1.5 h)

3. Kontrola przepływu (if-then-else, pętle) (1.5 h)

4. Operacje na danych: zastosowanie metod do obiektów (1.5 h)

5. Podstawy NumPy – operacje na macierzach (1.5 h)

6. Funkcje (1.5 h)

7. Przygotowanie i podstawowe przetwarzanie danych: importowanie zbiorów danych, ‘czyszczenie’, zapisywanie danych (3 h)

8. Przetwarzanie ‘wyczyszczonych’ zbiorów danych z wykorzystaniem biblioteki Pandas (4.5 h)

9. Wizualizacja danych (1.5 h)

10. Zastosowanie metod analizy danych (w zależności od potrzeb uczestników i pozostałego czasu) (3h)

11. Rozpoznawanie błędów i odnajdywanie sposobów ich naprawienia/rozwiązania (sukcesywnie w trakcie kursu)

Literatura:

W. McKinney, 2012, Python for Data Analysis, O’Reilly Media [tytuł PL: Python w analizie danych]

J. Grus, 2015, Data Science from Scratch, O’Reilly Media [tytuł PL: Data Science od podstaw]

Efekty uczenia się:

Student rozumie czym jest programowanie obiektowe.

Student potrafi przygotować środowisko potrzebne do korzystania z języka Python.

Student zna podstawy programowania w języku Python.

Student potrafi rozpoznawać błędy i odnaleźć sposób ich rozwiązania.

Student potrafi zaimportować dane i określić ich jakość.

Student rozumie problemy związane z koniecznością „czyszczenia” danych o niskiej jakości i potrafi te problemy rozwiązać.

Student potrafi przetwarzać dane, w zależności od jego potrzeb i postaci do jakiej potrzebuje je przetransformować na potrzeby dalszej analizy.

Student zna podstawowe metody do analizy i wizualizacji danych.

Student nabiera świadomości w jak dużym stopniu programowanie usprawnia pracę z danymi.

Metody i kryteria oceniania:

1. Kolokwium sprawdzające wiedzę nabytą w pierwszej części zajęć (50%).

2. Przygotowanie własnego projektu na podstawie przerobionego materiału (50%). Główne kryterium oceniania to poziom wykorzystania narzędzi i metod poznanych w trakcie zajęć. Możliwość wykorzystania narzędzi do publikowania stworzonego projektu (github, nbviewer), pozwalających na udowodnienie nabytych umiejętności w CV. Koncepcja projektu, w miarę potrzeb, w konsultacji z prowadzącym. Możliwe wskazówki od prowadzącego na temat koncepcji, na podstawie zainteresowań studenta.

Przedmiot nie jest oferowany w żadnym z aktualnych cykli dydaktycznych.
Opisy przedmiotów w USOS i USOSweb są chronione prawem autorskim.
Właścicielem praw autorskich jest Uniwersytet Warszawski.
ul. Banacha 2
02-097 Warszawa
tel: +48 22 55 44 214 https://www.mimuw.edu.pl/
kontakt deklaracja dostępności USOSweb 7.0.2.0-80474ed05 (2024-03-12)