Serwisy internetowe Uniwersytetu Warszawskiego | USOSownia - uniwersyteckie forum USOSoweNie jesteś zalogowany | zaloguj się
katalog przedmiotów - pomoc

Inżynieria lingwistyczna - konstrukcje

Informacje ogólne

Kod przedmiotu: 1000-2M07LK Kod Erasmus / ISCED: 11.303 / (0612) Database and network design and administration
Nazwa przedmiotu: Inżynieria lingwistyczna - konstrukcje
Jednostka: Wydział Matematyki, Informatyki i Mechaniki
Grupy: Przedmioty monograficzne dla III - V roku informatyki
Przedmioty obieralne dla informatyki
Punkty ECTS i inne: (brak)
zobacz reguły punktacji
Język prowadzenia: angielski
Rodzaj przedmiotu:

monograficzne

Skrócony opis:

Celem wykładu jest przedstawienie często wykorzystywanych w praktyce metod i technik przetwarzania języków naturalnych, przede wszystkim technik przetwarzania składniowego i semantycznego. Techniki te będą ilustrowane konkretnymi zadaniami (ekstrakcja informacji, systemy dialogowe, itp.) na bazie języka polskiego i angielskiego. Niniejszy wykład skupia się na metodach wysokopoziomowych, w dużym stopniu zależnych od danego języka. Wykład jest w zasadzie niezależny od wykładu Inżynieria lingwistyczna ? słowa, ale dopiero uczestnictwo w obu wykładach da pełny obraz Inżynierii lingwistycznej.

W przypadku braku studentów obcojęzycznych, zajęcia będą prowadzone po polsku.

Pełny opis:

1. Wprowadzenie. Terminologia (inżynieria lingwistyczna, lingwistyka informatyczna, NLP, HLT itp.), historia, zastosowania, dwa paradygmaty (symboliczny i statystyczny). (1 wykład)

2. Typy przetwarzania składniowego, parsowanie powierzchniowe, parsowanie jako tagowanie. (1 wykład)

3. Parsowanie powierzchniowe w wykorzystaniem gramatyk regularnych, gramatyki kaskadowe. (1 wykład)

4. Ekstrakcja informacji. (1 wykład)

5. Parsowanie głębokie, gramatyki i parsery bezkontekstowe. (1-2 wykłady)

6. Banki drzew i parsery stochastyczne. (1 wykład)

7. Formalizmy i parsery zależnościowe. (1 wykład)

8. Gramatyki i parsery unifikacyjne (DCG, PATR-II, HPSG). (1-2 wykłady)

9. Semantyka: leksykalna i kompozycyjna, reprezentacje znaczenia, formalizmy semantyczne. (1 wykład)

10. Semantyka Montague i/lub Discourse Representation Theory. (1 wykład)

11. Semantyka w gramatykach bezkontekstowych, zależnościowych i unifikacyjnych. (1-2 wykłady)

12. Generacja tekstów i tradycyjne podejścia do tłumaczenia maszynowego. (1 wykład)

13. Reprezentacja dyskursu, systemy dialogowe. (1 wykład)

W przypadku braku studentów obcojęzycznych, zajęcia będą prowadzone po polsku.

Literatura:

1. Steven Bird, Ewan Klein i Edward Loper 2009, „Natural Language Processing – Analyzing Text with Python and the Natural Language Toolkit”, http://www.nltk.org/book.

2. Daniel Jurafsky i James H. Martin 2009, „Speech and Language Processing”, Prentice-Hall (2. wydanie).

3. Sandra Kübler, Ryan McDonald i Joakim Nivre 2009, „Dependency Parsing”, Morgan & Claypool.

4. Adam Przepiórkowski 2008, „Powierzchniowe przetwarzanie języka polskiego”, EXIT, Warszawa.

Przedmiot nie jest oferowany w żadnym z aktualnych cykli dydaktycznych.
Opisy przedmiotów w USOS i USOSweb są chronione prawem autorskim.
Właścicielem praw autorskich jest Uniwersytet Warszawski.