Uniwersytet Warszawski - Centralny System Uwierzytelniania
Strona główna

Natural language processing

Informacje ogólne

Kod przedmiotu: 1000-318bNLP
Kod Erasmus / ISCED: 11.3 Kod klasyfikacyjny przedmiotu składa się z trzech do pięciu cyfr, przy czym trzy pierwsze oznaczają klasyfikację dziedziny wg. Listy kodów dziedzin obowiązującej w programie Socrates/Erasmus, czwarta (dotąd na ogół 0) – ewentualne uszczegółowienie informacji o dyscyplinie, piąta – stopień zaawansowania przedmiotu ustalony na podstawie roku studiów, dla którego przedmiot jest przeznaczony. / (0612) Database and network design and administration Kod ISCED - Międzynarodowa Standardowa Klasyfikacja Kształcenia (International Standard Classification of Education) została opracowana przez UNESCO.
Nazwa przedmiotu: Natural language processing
Jednostka: Wydział Matematyki, Informatyki i Mechaniki
Grupy: Przedmioty obieralne dla informatyki
Przedmioty obieralne na studiach drugiego stopnia na kierunku bioinformatyka
Przedmioty obowiązkowe dla I roku Machine Learning
Punkty ECTS i inne: 5.00 Podstawowe informacje o zasadach przyporządkowania punktów ECTS:
  • roczny wymiar godzinowy nakładu pracy studenta konieczny do osiągnięcia zakładanych efektów uczenia się dla danego etapu studiów wynosi 1500-1800 h, co odpowiada 60 ECTS;
  • tygodniowy wymiar godzinowy nakładu pracy studenta wynosi 45 h;
  • 1 punkt ECTS odpowiada 25-30 godzinom pracy studenta potrzebnej do osiągnięcia zakładanych efektów uczenia się;
  • tygodniowy nakład pracy studenta konieczny do osiągnięcia zakładanych efektów uczenia się pozwala uzyskać 1,5 ECTS;
  • nakład pracy potrzebny do zaliczenia przedmiotu, któremu przypisano 3 ECTS, stanowi 10% semestralnego obciążenia studenta.

zobacz reguły punktacji
Język prowadzenia: angielski
Rodzaj przedmiotu:

monograficzne

Wymagania (lista przedmiotów):

Głębokie sieci neuronowe (wspólne z 1000-317bDNN) 1000-2M16GSN

Skrócony opis:

Celem przedmiotu jest zapoznanie studentów z teorią, metodyk, zasobami i narzędziami przetwarzania języka naturalnego. Wykłady dotyczą tematów związanych z lingwistyką komputerową (analiza morfologiczna, syntaktyczna i semantyczna), ekstrakcją informacji, klasyfikacją tekstów oraz automatycznym streszczaniem dokumentów. Na przedmiocie będziemy omawiali narzędzia i problemy związane z językami angielskim i polskim. Pomocna będzie znajomość teorii gramatyk formalnych i technik uczenia maszynowego.

Pełny opis:

1. Wprowadzenie, wektory słów

2. Modele podsłowowe

3. Struktura lingwistyczna: parsowanie zależności

4. Rekurencyjne sieci neuronowe i modele językowe

5. Translacja maszynowa, seq2seq i skupianie uwagi

6. Mechanizmy skupiania uwagi

7. Reprezentacje kontekstowe i wstępne trenowanie

8. Systemy dialogowe

9. Generowanie języka naturalnego

10. Odpowiadanie na pytania

11. Uczenie wielozadaniowe

Literatura:

Dan Jurafsky and James H. Martin. Speech and Language Processing

Jacob Eisenstein. Natural Language Processing

Yoav Goldberg. A Primer on Neural Network Models for Natural Language Processing

Ian Goodfellow, Yoshua Bengio, and Aaron Courville. Deep Learning

Delip Rao and Brian McMahan. Natural Language Processing with PyTorch

Efekty uczenia się:

Wiedza: student zna i rozumie

* zna metodyki, zagadnienia i techniki oraz narzędzia służące do przetwarzania języka naturalnego [K_W13].

Umiejętności: student potrafi

* potrafi zastosować w praktyce techniki przetwarzania języka naturalnego [K_U16].

Kompetencje społeczne: student jest gotów do

* krytycznej oceny posiadanej wiedzy i odbieranych treści [K_K01];

* uznawania znaczenia wiedzy w rozwiązywaniu problemów poznawczych i praktycznych oraz zasięgania opinii ekspertów w przypadku trudności z samodzielnym * rozwiązaniem problemu [K_K02];

* myślenia i działania w sposób przedsiębiorczy [K_K03].

Metody i kryteria oceniania:

Ocena końcowa na podstawie punktów z zadań (programów) zaliczeniowych, egzaminu pisemnego oraz egzaminu ustnego.

Zajęcia w cyklu "Semestr letni 2023/24" (w trakcie)

Okres: 2024-02-19 - 2024-06-16
Wybrany podział planu:
Przejdź do planu
Typ zajęć:
Laboratorium, 30 godzin więcej informacji
Wykład, 30 godzin więcej informacji
Koordynatorzy: Paweł Budzianowski, Juliusz Straszyński
Prowadzący grup: Paweł Budzianowski, Mateusz Doliński, Jan Ludziejewski, Spyridon Mouselinos, Grzegorz Preibisch, Juliusz Straszyński, Emilia Wiśnios
Lista studentów: (nie masz dostępu)
Zaliczenie: Egzamin
Opisy przedmiotów w USOS i USOSweb są chronione prawem autorskim.
Właścicielem praw autorskich jest Uniwersytet Warszawski.
ul. Banacha 2
02-097 Warszawa
tel: +48 22 55 44 214 https://www.mimuw.edu.pl/
kontakt deklaracja dostępności USOSweb 7.0.3.0-2b06adb1e (2024-03-27)