Inżynieria lingwistyczna - konstrukcje
Informacje ogólne
Kod przedmiotu: | 1000-2M07LK |
Kod Erasmus / ISCED: |
11.303
|
Nazwa przedmiotu: | Inżynieria lingwistyczna - konstrukcje |
Jednostka: | Wydział Matematyki, Informatyki i Mechaniki |
Grupy: |
Przedmioty obieralne dla informatyki Przedmioty obieralne na studiach drugiego stopnia na kierunku bioinformatyka |
Punkty ECTS i inne: |
(brak)
|
Język prowadzenia: | angielski |
Rodzaj przedmiotu: | monograficzne |
Skrócony opis: |
Celem wykładu jest przedstawienie często wykorzystywanych w praktyce metod i technik przetwarzania języków naturalnych, przede wszystkim technik przetwarzania składniowego i semantycznego. Techniki te będą ilustrowane konkretnymi zadaniami (ekstrakcja informacji, systemy dialogowe, itp.) na bazie języka polskiego i angielskiego. Niniejszy wykład skupia się na metodach wysokopoziomowych, w dużym stopniu zależnych od danego języka. Wykład jest w zasadzie niezależny od wykładu Inżynieria lingwistyczna ? słowa, ale dopiero uczestnictwo w obu wykładach da pełny obraz Inżynierii lingwistycznej. W przypadku braku studentów obcojęzycznych, zajęcia będą prowadzone po polsku. |
Pełny opis: |
1. Wprowadzenie. Terminologia (inżynieria lingwistyczna, lingwistyka informatyczna, NLP, HLT itp.), historia, zastosowania, dwa paradygmaty (symboliczny i statystyczny). (1 wykład) 2. Typy przetwarzania składniowego, parsowanie powierzchniowe, parsowanie jako tagowanie. (1 wykład) 3. Parsowanie powierzchniowe w wykorzystaniem gramatyk regularnych, gramatyki kaskadowe. (1 wykład) 4. Ekstrakcja informacji. (1 wykład) 5. Parsowanie głębokie, gramatyki i parsery bezkontekstowe. (1-2 wykłady) 6. Banki drzew i parsery stochastyczne. (1 wykład) 7. Formalizmy i parsery zależnościowe. (1 wykład) 8. Gramatyki i parsery unifikacyjne (DCG, PATR-II, HPSG). (1-2 wykłady) 9. Semantyka: leksykalna i kompozycyjna, reprezentacje znaczenia, formalizmy semantyczne. (1 wykład) 10. Semantyka Montague i/lub Discourse Representation Theory. (1 wykład) 11. Semantyka w gramatykach bezkontekstowych, zależnościowych i unifikacyjnych. (1-2 wykłady) 12. Generacja tekstów i tradycyjne podejścia do tłumaczenia maszynowego. (1 wykład) 13. Reprezentacja dyskursu, systemy dialogowe. (1 wykład) W przypadku braku studentów obcojęzycznych, zajęcia będą prowadzone po polsku. |
Literatura: |
1. Steven Bird, Ewan Klein i Edward Loper 2009, „Natural Language Processing – Analyzing Text with Python and the Natural Language Toolkit”, http://www.nltk.org/book. 2. Daniel Jurafsky i James H. Martin 2009, „Speech and Language Processing”, Prentice-Hall (2. wydanie). 3. Sandra Kübler, Ryan McDonald i Joakim Nivre 2009, „Dependency Parsing”, Morgan & Claypool. 4. Adam Przepiórkowski 2008, „Powierzchniowe przetwarzanie języka polskiego”, EXIT, Warszawa. |
Właścicielem praw autorskich jest Uniwersytet Warszawski.