Uniwersytet Warszawski - Centralny System Uwierzytelniania
Strona główna

Inżynieria lingwistyczna - konstrukcje

Informacje ogólne

Kod przedmiotu: 1000-2M07LK
Kod Erasmus / ISCED: 11.303 Kod klasyfikacyjny przedmiotu składa się z trzech do pięciu cyfr, przy czym trzy pierwsze oznaczają klasyfikację dziedziny wg. Listy kodów dziedzin obowiązującej w programie Socrates/Erasmus, czwarta (dotąd na ogół 0) – ewentualne uszczegółowienie informacji o dyscyplinie, piąta – stopień zaawansowania przedmiotu ustalony na podstawie roku studiów, dla którego przedmiot jest przeznaczony. / (0612) Database and network design and administration Kod ISCED - Międzynarodowa Standardowa Klasyfikacja Kształcenia (International Standard Classification of Education) została opracowana przez UNESCO.
Nazwa przedmiotu: Inżynieria lingwistyczna - konstrukcje
Jednostka: Wydział Matematyki, Informatyki i Mechaniki
Grupy: Przedmioty obieralne dla informatyki
Przedmioty obieralne na studiach drugiego stopnia na kierunku bioinformatyka
Punkty ECTS i inne: (brak) Podstawowe informacje o zasadach przyporządkowania punktów ECTS:
  • roczny wymiar godzinowy nakładu pracy studenta konieczny do osiągnięcia zakładanych efektów uczenia się dla danego etapu studiów wynosi 1500-1800 h, co odpowiada 60 ECTS;
  • tygodniowy wymiar godzinowy nakładu pracy studenta wynosi 45 h;
  • 1 punkt ECTS odpowiada 25-30 godzinom pracy studenta potrzebnej do osiągnięcia zakładanych efektów uczenia się;
  • tygodniowy nakład pracy studenta konieczny do osiągnięcia zakładanych efektów uczenia się pozwala uzyskać 1,5 ECTS;
  • nakład pracy potrzebny do zaliczenia przedmiotu, któremu przypisano 3 ECTS, stanowi 10% semestralnego obciążenia studenta.

zobacz reguły punktacji
Język prowadzenia: angielski
Rodzaj przedmiotu:

monograficzne

Skrócony opis:

Celem wykładu jest przedstawienie często wykorzystywanych w praktyce metod i technik przetwarzania języków naturalnych, przede wszystkim technik przetwarzania składniowego i semantycznego. Techniki te będą ilustrowane konkretnymi zadaniami (ekstrakcja informacji, systemy dialogowe, itp.) na bazie języka polskiego i angielskiego. Niniejszy wykład skupia się na metodach wysokopoziomowych, w dużym stopniu zależnych od danego języka. Wykład jest w zasadzie niezależny od wykładu Inżynieria lingwistyczna ? słowa, ale dopiero uczestnictwo w obu wykładach da pełny obraz Inżynierii lingwistycznej.

W przypadku braku studentów obcojęzycznych, zajęcia będą prowadzone po polsku.

Pełny opis:

1. Wprowadzenie. Terminologia (inżynieria lingwistyczna, lingwistyka informatyczna, NLP, HLT itp.), historia, zastosowania, dwa paradygmaty (symboliczny i statystyczny). (1 wykład)

2. Typy przetwarzania składniowego, parsowanie powierzchniowe, parsowanie jako tagowanie. (1 wykład)

3. Parsowanie powierzchniowe w wykorzystaniem gramatyk regularnych, gramatyki kaskadowe. (1 wykład)

4. Ekstrakcja informacji. (1 wykład)

5. Parsowanie głębokie, gramatyki i parsery bezkontekstowe. (1-2 wykłady)

6. Banki drzew i parsery stochastyczne. (1 wykład)

7. Formalizmy i parsery zależnościowe. (1 wykład)

8. Gramatyki i parsery unifikacyjne (DCG, PATR-II, HPSG). (1-2 wykłady)

9. Semantyka: leksykalna i kompozycyjna, reprezentacje znaczenia, formalizmy semantyczne. (1 wykład)

10. Semantyka Montague i/lub Discourse Representation Theory. (1 wykład)

11. Semantyka w gramatykach bezkontekstowych, zależnościowych i unifikacyjnych. (1-2 wykłady)

12. Generacja tekstów i tradycyjne podejścia do tłumaczenia maszynowego. (1 wykład)

13. Reprezentacja dyskursu, systemy dialogowe. (1 wykład)

W przypadku braku studentów obcojęzycznych, zajęcia będą prowadzone po polsku.

Literatura:

1. Steven Bird, Ewan Klein i Edward Loper 2009, „Natural Language Processing – Analyzing Text with Python and the Natural Language Toolkit”, http://www.nltk.org/book.

2. Daniel Jurafsky i James H. Martin 2009, „Speech and Language Processing”, Prentice-Hall (2. wydanie).

3. Sandra Kübler, Ryan McDonald i Joakim Nivre 2009, „Dependency Parsing”, Morgan & Claypool.

4. Adam Przepiórkowski 2008, „Powierzchniowe przetwarzanie języka polskiego”, EXIT, Warszawa.

Przedmiot nie jest oferowany w żadnym z aktualnych cykli dydaktycznych.
Opisy przedmiotów w USOS i USOSweb są chronione prawem autorskim.
Właścicielem praw autorskich jest Uniwersytet Warszawski.
ul. Banacha 2
02-097 Warszawa
tel: +48 22 55 44 214 https://www.mimuw.edu.pl/
kontakt deklaracja dostępności USOSweb 7.0.2.0-80474ed05 (2024-03-12)