Úvod do počítačové lingvistiky
Z ωικι.matfyz.cz
Úvod do počítačové lingvistiky | ||||
|
Úvodní přednáška do počítačové lingvistiky. Výklad doktora Kuboně je srozumitelný a v rozumné míře zábavný, poměr teorie a praktických ukázek je vyrovnaný.
Zkouška
Na zkoušku se lze během jednoho dne v pohodě naučit (tomu, kdo nechodil na přednášky, to může trvat o něco déle). Zkouška je písemná, jedna velká otázka a 7 menších. Na jedničku je třeba umět všechna klíčová slova k dané otázce.
Otázky
- Co je wordnet?
- Popište systém ASIMUT.
- Podrobně popiště systém MOSAIC.
- Používá MOSAIC syntaktickou analýzu? Proč?
- Co je a na co slouží strukturní index u Chomského gramatiky?
- Pražský závislostní korpus (PDT)
- Unifikační gramatiky - výhody/nevýhody
- Systém Česílko
- Kontrola překlepů
- Co je morfém a jak ho klasifikujeme?
- Nakreslete složkový a závislostní strom pro větu "Ve včerejším závodu startovali výborní skokani."
- Převeďte složkový strom na závislostní
- Co je překladová paměť?
- Co je vyhlazování?
- Brownův korpus
- Co je ontologie a jak se používá?
- Chomskeho teorie
- Co je alomorf?
- Bickel-Schroderova metoda
- PennTreebank
- Sestavy rysu a jejich použití.
- Co je transfér v automatickém překladu – přenos zanalyzované věty z jednoho jazyka do druhého (slovosled, morfologie)
- Jaký je rozdíl mezi interlinguou a pivotním jazykem?
- Co je TAG (velmi stručně popište)
- Popište model zašuměného kanálu.
- Funkční generativní popis stručně
- Statistické metody prekladu
- co je LFG?
- co je Two-Level morphology?
- BLEU
- rozdil intenze/extenze
- transparentní intenzionální logika
- co je ATN? (Augmented transition network)
- Stručně popište Český národní korpus(složení, velikost, typy značek).
- Popište Vauquoisův trojúhelník. (trojúhelník s interlinguou na vrcholu)
- Stručně popište systém METEO.
- Stručně popište rozdíl mezi hloubkovou a povrchovou rovinou analýzy syntaxe.
- rozdil mezi morfologickou analyzou a taggingem
- 3 hlavní přístupy k popisu morfologie
- Q systemy (k comu sluzia, kde su aplikované, ako funguju)
- dělení anafor a jak se řeší algoritmicky
- Co je to lemmatizace a kde se používá?
- ALPAC
- metody kontroly gramatickej spravnosti viet (hlavne javy, specificke javy pre cestinu, implementacia)
- Co je to teorie minimalismu, kdo je autorem a co jí předcházelo
Poznámky
Materiály
Materiály (slajdy a draft skript) posílá přednášející mailem všem, co mají předmět zapsaný. Případně jsou dostupné v SISu na stránce předmětu (po přihlášení). Případně existuje i vypracovaný hangout od studentů.
Literatura
- Eva Hajičová, Jarmila Panevová, Petr Sgall: Úvod do teoretické a počítačové lingvistiky, I. svazek – Teoretická lingvistika (Karolinum 2002, ISBN 80-246-0470-1)
- kniha je dostupná ve fakultní knihovně na Malé Straně