Przetwarzanie i analiza danych w języku Python
Informacje ogólne
Kod przedmiotu: | 2400-ZEWW779 |
Kod Erasmus / ISCED: |
14.3
|
Nazwa przedmiotu: | Przetwarzanie i analiza danych w języku Python |
Jednostka: | Wydział Nauk Ekonomicznych |
Grupy: |
Przedmioty kierunkowe do wyboru - studia II stopnia EM - grupa 1 (3*30h) Przedmioty kierunkowe do wyboru - studia II stopnia EM - grupa 2 (1*30h) Przedmioty kierunkowe do wyboru - studia II stopnia IE - grupa 1 (6*30h) Przedmioty wyboru kierunkowego dla studiów licencjackich EM Przedmioty wyboru kierunkowego dla studiów licencjackich IE Przedmioty wyboru kierunkowego dla studiów licencjackich MSEM |
Punkty ECTS i inne: |
(brak)
|
Język prowadzenia: | polski |
Rodzaj przedmiotu: | nieobowiązkowe |
Skrócony opis: |
Celem zajęć jest wprowadzenie uczestników do programowania w języku Python, szczególnie w kontekście analizy i wizualizacji danych. W trakcie zajęć przedstawione zostaną odpowiednie narzędzia umożliwiające sprawne przygotowanie i obróbkę danych, a także metody wykorzystywane do analizy ekonomicznej. Dzięki temu każdy z uczestników będzie przygotowany do podjęcia bardziej zaawansowanych kursów programowania w przyszłości. Tempo zajęć i zakres materiału dopasowane zostaną do potrzeb uczestników. Wcześniejsza znajomość języka Python nie jest wymagana do udziału w zajęciach. |
Pełny opis: |
1. Wprowadzenie do programowania obiektowego. Instalacja środowiska, zapoznanie z Ipython Notebook. (1.5 h) 2. Struktury danych (string, lista, krotka, słownik, zbiór, data-frame) (1.5 h) 3. Kontrola przepływu (if-then-else, pętle) (1.5 h) 4. Operacje na danych: zastosowanie metod do obiektów (1.5 h) 5. Podstawy NumPy – operacje na macierzach (1.5 h) 6. Funkcje (1.5 h) 7. Przygotowanie i podstawowe przetwarzanie danych: importowanie zbiorów danych, ‘czyszczenie’, zapisywanie danych (3 h) 8. Przetwarzanie ‘wyczyszczonych’ zbiorów danych z wykorzystaniem biblioteki Pandas (4.5 h) 9. Wizualizacja danych (1.5 h) 10. Zastosowanie metod analizy danych (w zależności od potrzeb uczestników i pozostałego czasu) (3h) 11. Rozpoznawanie błędów i odnajdywanie sposobów ich naprawienia/rozwiązania (sukcesywnie w trakcie kursu) |
Literatura: |
W. McKinney, 2012, Python for Data Analysis, O’Reilly Media [tytuł PL: Python w analizie danych] J. Grus, 2015, Data Science from Scratch, O’Reilly Media [tytuł PL: Data Science od podstaw] |
Efekty uczenia się: |
Student rozumie czym jest programowanie obiektowe. Student potrafi przygotować środowisko potrzebne do korzystania z języka Python. Student zna podstawy programowania w języku Python. Student potrafi rozpoznawać błędy i odnaleźć sposób ich rozwiązania. Student potrafi zaimportować dane i określić ich jakość. Student rozumie problemy związane z koniecznością „czyszczenia” danych o niskiej jakości i potrafi te problemy rozwiązać. Student potrafi przetwarzać dane, w zależności od jego potrzeb i postaci do jakiej potrzebuje je przetransformować na potrzeby dalszej analizy. Student zna podstawowe metody do analizy i wizualizacji danych. Student nabiera świadomości w jak dużym stopniu programowanie usprawnia pracę z danymi. |
Metody i kryteria oceniania: |
1. Kolokwium sprawdzające wiedzę nabytą w pierwszej części zajęć (50%). 2. Przygotowanie własnego projektu na podstawie przerobionego materiału (50%). Główne kryterium oceniania to poziom wykorzystania narzędzi i metod poznanych w trakcie zajęć. Możliwość wykorzystania narzędzi do publikowania stworzonego projektu (github, nbviewer), pozwalających na udowodnienie nabytych umiejętności w CV. Koncepcja projektu, w miarę potrzeb, w konsultacji z prowadzącym. Możliwe wskazówki od prowadzącego na temat koncepcji, na podstawie zainteresowań studenta. |
Właścicielem praw autorskich jest Uniwersytet Warszawski.