Státnice I3: Formální sémantika
Tato stránka shrnuje látku probíranou v rámci předmětu Úvod do teoretické sémantiky --Rajjo 01:04, 19 Aug 2010 (CEST)
Formální sémantika:
- interdisciplinární směr, ve kterém se spojili formálně orientovaní lingvisté, filosofové, logikové, i někteří odborníci z oblasti computer science
- souvisí s rozvojem intenzionální sémantiky a vznikem dalších formálně-sémantických systémů, které reagovaly na diskuse o jejích omezeních
Úvod
- Chomsky - inicioval interakci mezi lingvistikou a matematikou
- otázka, zda by bylo možné aplikovat matematické metody, které se ukázaly užitečné pro analýzu syntaxe, také na sémantiku
- Syntax: zabývá se výrazy a jejich skladbou vs Sémantika: studuje významy, u nichž je zásadně problematické se shodnout byť i jen na tom, čím vlastně jsou, natož pak na tom, jak je uchopit
- první pokusy o matematické uchopení sémantiky přirozeného jazyka
- generativní sémantika Lakoffa a McCawleyho
- teorie J.J. Katze a P. Postala
- logická forma (Chomsky, Jackendoff)
- v Čechách se v rámci Sgallovy varianty generativní gramatiky, funkčního generativního popisu, rozvinula koncepce tektogramatiky
- kritika od filosofů a logiků, že sémantika nějak zásadně souvisí s pravdivostí a pravdivostními podmínkami, které výše jmenované přístupy nepostihují - jenom překlady z jednoho jazyka (toho přirozeného) do jazyka jiného, jakési stromovštiny
- Teorie sémantiky formálních jazyků
- vycházely z propojení významu s pravdou
- na sklonku devatenáctého století jeden ze zakladatelů moderní logiky, německý matematik a filosof Gottlob Frege nastínil, jakým způsobem by mohla logika význam matematicky zachytit. Alfred Tarski, Rudolf Carnap a další je potom v podstatě jenom zaintegrovali do rozvíjející se formální logiky.
- z hlediska teorií přirozeného jazyka byl problém ve dvou věcech:
- jazyky, se kterými logici běžně pracovali a pro které budovali své formální teorie sémantiky, měly ve srovnání s přirozeným jazykem příliš jednoduchou syntaktickou strukturu
- sémantika, kterou byly opatřovány, nebylo možné považovat za realistickou explikaci významů, jaké mají výrazy v přirozeném jazyce
- kolem roku 1970 se objevily formální jazyky, jejichž sémantika již nebyla z hlediska explikace sémantiky jazyka přirozeného tak nepoužitelná jako sémantika standardní logiky
- modální logiky - logiky možnosti a nutnosti
- intenzionální logika - opírá se o pojem možného světa
- americký logik Richard Montague
- český logik Pavel Tichý
- zákldní myšlenka: matematizace významu
- zapojením možných světů přechod od extenzionálního k intenzionálnímu modelu sémantiky přirozeného jazyka
Extenzionální model významu
Principy extenzionální sémantiky
- funkcionální koncepce sémantiky
Fregův manévr
- významy některých druhů výrazů by bylo možné explikovat jako určité funkce v matematickém slova smyslu
- podmět obvykle označuje nějakou věc: např. podmět „Gottlob Frege“ označuje Gottloba Frega
- (oznamovací) věta označuje svou pravdivostní hodnotu: věta „Gottlob Frege je dramatik“ označuje nepravdu (Frege nebyl dramatik)
- predikát $ P $ spolu s podmětem $ N_1 $ vytvoří nějakou větu $ V_1 $, s podmětem $ N_2 $ vytvoří $ V_2 $
- $ P + N_1 = V_1 $ “být dramatikem” + “Frege” = “Frege je dramatikem”
- $ P + N_2 = V_2 $ “být dramatikem” + “prezident ČR” = “Prezident ČR je dramatikem” (za dob Václava Havla)
- predikát $ P $ můřeme vidět jako prostředek přiřazení věty $ V_1 $ podmětu $ N_1 $
- $ P: N_1 \rightarrow V_1 $ “být dramatikem”: “Frege” $ \rightarrow $ “Frege je dramatikem”
- $ N_2 \rightarrow V_2 $ “prezident ČR” $ \rightarrow $ “Prezident ČR je dramatikem”
- denotát ║Y║ - to, co je označováno výrazem Y
- $ ||P||: ||N_1|| \rightarrow ||V_1|| $
- $ ||N_2|| \rightarrow ||V_2|| $
- ║být dramatikem║: ║Frege║ $ \rightarrow $ ║Frege je dramatikem║
- ║prezident ČR║ $ \rightarrow $ ║Prezident ČR je dramatikem║
- denotáty podmětů jsou jimi pojmenovávané věci a denotáty výroků jejich pravdivostní hodnoty
- ║být dramatikem║ je funkce, která přiřazuje osobě Gottlobu Fregovi pravdivostní hodnotu nepravda (N) a Václavu Havlovi pravda (P)
- zobecnění Fregova manévru na spojky nebo příslovce
- spojka zřejmě ‘vyrábí’ větu z dvojice vět - její denotát tedy můžeme ztotožnit s funkcí, přiřazující pravdivostní hodnoty dvojicím pravdivostních hodnot
- ║a║ bude přiřazovat P pouze dvojici $ <P,P> $, zatímco ║nebo║ bude přiřazovat P každé dvojici kromě $ <N,N> $
- příslovce se spojují s (unárními) predikáty v komplexní (unární) predikáty
- spojka zřejmě ‘vyrábí’ větu z dvojice vět - její denotát tedy můžeme ztotožnit s funkcí, přiřazující pravdivostní hodnoty dvojicím pravdivostních hodnot
Extenze a Intenze
POZOR: fregovské denotáty jistě nejsou přijatelnými explikáty významů v intuitivním slova smyslu
- významem věty by byla její pravdivostní hodnota a všechny pravdivé věty by tudíž měly stejný význam
- proto Frege zavedl pojmy význam (ve formě denotátů) vs smysl (intuitivní smysl slova)
- později byly tyto dva pojmy nahrazeny pojmy extenze (význam) a intenze (smysl)
Možný svět
- znát intenzi výrazu znamená být schopen určit jeho extenzi v každém možném světě
- intenzi výrazu tedy můžeme obecně ztotožnit s funkcí, přiřazující každému možnému světu extenzi tohoto výrazu v tomto možném světě
- intenzí výroku je funkce, která každému možnému světu přiřadí pravdivostní hodnotu tohoto výroku v tomto možném světě
- intenzí singulární fráze je funkce, která každému možnému světu přiřadí objekt označovaný touto frází v tomto možném světě
- intenzí predikativní fráze je funkce, která každému možnému světu přiřadí třídu objektů, o kterých je tento predikát pravdivý v tomto možném světě
Model jazyka odpovídající standardnímu predikátovému počtu
Sémantický model jazyka je tvořen čtyřmi komponentami:
- slovník
- syntaktická pravidla
- přiřazení denotátů slovům
- pravidla pro to, jak „počítat“ denotáty složených výrazů z denotátů jejich složek
Všechna pravidla bodu 4 mají tvar ‘vezmi denotát jedné složky a aplikuj ho na denotáty těch ostatních‘
Kategoriální gramatika a teorie typů
Kategoriální gramatika
- zobecnění Fregova manévru (funkční aplikace)
- jazyk, jehož všechna pravidla fungují jako funkční aplikace
- máme-li gramatické pravidlo, které kombinuje výrazy kategorií $ K_1 ... K_n $ ve výraz kategorie $ K $, pak denotáty výrazů jedné z kategorií $ K_1 ... K_n $, řekněme $ K_i $, musí být funkcemi aplikovatelnými na denotáty výrazů zbylých kategorií $ K_1, ... ,K_{i-1},K_{i+1}, ... ,K_n $
- kategorii $ K_i $ budeme označovat indexem $ K / K_1, ... ,K_{i-1},K_{i+1}, ... ,K_n $
Teorie typů
- kategorie výroků a termů budeme označovat V a T
- pak bude kategorie predikátů označena jako V/T (predikát potřebuje term, aby vytvořil výrok)
- spojky a či nebo můžeme nahlédnout výrazy kategorie V/V,V a příslovce jako výrazy kategorie (V/T)/(V/T)
Komponenty kategoriální gramatiky
- Slovník
- soubor KAT primitivních kategorií (např. kategorií V a T)
- další gramatické kategorie dostaneme pomocí operace lomítka
- kdykoli jsou $ K_1 $ a $ K_2 $ gramatickými kategoriemi, je gramatickou kategorií i $ K_1/K_2 $
- každá kategorie pak obsahuje nejvýše konečný počet slov
- Syntax
- každé slovo kategorie K je výrazem kategorie K
- pravidlo pro kombinaci výrazů:
- je-li Y výraz kategorie $ K_1/K_2 $ a je-li Z výraz kategorie $ K_2 $, je Y(Z) výrazem kategorie $ K_1 $
- Denotáty slov
- každé primitivní kategorii K je dána množina $ D_K $, tzv. doména kategorie K
- doménou $ D_T $ přiřazenou kategorii T může být nějaká daná množina individuí D
- doménou $ D_V $ přiřazenou kategorii V množina {P,N} dvou pravdivostních hodnot
- přiřazení rozšíříme na všechny kategorie tak, že za $ D_{B/A} $ vezmeme množinu všech funkcí z $ D_A $ do $ D_B $, kterou budeme značit $ [D_A \Rightarrow D_B] $
- každé primitivní kategorii K je dána množina $ D_K $, tzv. doména kategorie K
- Denotáty složených výrazů
- denotát ║Y(Z)║ složeného výrazu Y(Z) je dán jako hodnota ║Y║(║Z║) aplikace funkce ║Y║ na argument ║Z║
Lambda-abstrakce a lambda-kategoriální gramatika
- vezmeme nějaký složený výraz a „uděláme do něj díru“, tj. odstraníme z něj nějakou složku a nahradíme ji nějakým formálním symbolem, třeba písmenem x
- z výroku dramatik(Frege) můžeme udělat matrici dramatik(x)
- matrice dramatik(x) může být chápána jako předpis funkce $ \lambda x.dramatik(x) $, pro kterou platí $ f(║Z║) = ║Y^{x \leftarrow Z}║ $, kde $ Y^{x \leftarrow Z} $ značí variantu výrazu Y, ve které byl symbol x nahrazen výrazem Z
- pravidlo nahrazení složitějšího výrazu $ (\lambda x.Y)(Z) $ jednodušším $ Y^{x \leftarrow Z} $ nazýváme pravidlem lambda-konverze
- kategoriální gramatice obohacené o pravidlo lambda-konverze budeme říkat lambda-kategoriální gramatika
Intenzionální model významu
Meze extenzionální sémantiky, modální logika a pojem možného světa
- výroky Praha je město a Havel je dramatik jsou oba pravdivé a mají tedy tutéž extenzi, avšak jistě nemají tentýž význam
- ačkoli mají stejnou pravdivostní hodnotu, je možné, aby ji stejnou neměli. Mohl by jistě existovat svět, ve kterém by Havel byl dramatik, ale Praha byla pouhou vesnicí, či svět, kde by Praha byla městem, ale Havel byl třeba hospodským
- intenze výrazu je funkce, která každému možnému světu přiřadí extenzi tohoto výrazu v tomto možném světě
Extenze vs. intenze
- nyní namísto extenzí, které jsme potřebovali v rámci extenzionální sémantiky, potřebujeme funkce, které mají za definiční obor množinu všech možných světů a za obory hodnot extenze
- namísto objektů z $ D_T $ potřebujeme objekty $ [MS \Rightarrow D_T] $ (kde MS je množina všech možných světů), namísto $ [D_T \Rightarrow D_V] $ potřebujeme $ [MS \Rightarrow [D_T \Rightarrow D_V]] $
- denotát jednoduché věty bude výsledkem poněkud komplikovanější operace s denotáty jejích částí (kde w je možný svět):
║P(T)║(w) = (║P║(w))(║T║(w))
- někdy je potřeba k výpočtu denotátu komplexního výrazu v daném možném světě potřeba nejenom extenze jeho komponent v tomto možném světě. Např. ve větě
Frege hledá prezidenta ČR
- Frege může jistě hledat prezidenta ČR i v možném světě, ve kterém žádný takový prezident neexistuje (představme si například, že Česko je v tomto světě monarchií, což ovšem Frege neví)
- na predikát hledat můžeme nahlédnout nikoli jako vztah mezi extenzemi (individui), ale jako vztah mezi extenzí a intenzí, takže ║Hledat(N1,N2)║(w) nebude (║Hledat║(w))(║$ N_1 $║(w),║$ N_1 $║(w)), ale (║Hledat║(w))(║$ N_1 $║(w),║$ N_1 $║)
- rozlišení dvou typů postavení (supozic) výroku:
- de re
- výraz, který je součástí nějakého výroku a přispívá k pravdivostní hodnotě tohoto výroku v každém možném světě jen svou extenzí
- de dicto
- v ostatních případech, např. výraz prezident ČR je jako předmět slovesa hledat v supozici de dicto
- de re
Montaguova intenzionální logika
- výrazy mají intenze navíc kromě svých standardních denotátů
- výraz kategorie K má přiřazen jednak prvek $ D_K $ (denotát či extenzi) a jednak prvek $ [MS \Rightarrow D_K] $ (smysl či intenzi)
Tichého intenzionální logika a dvousortová teorie typů
- soubor základních kategorií extenzionálního lambda-kategoriálního jazyka, který je v typickém případě tvořen kategoriemi V a T, je obohacen o kvazikategorii S, které bude jako doména odpovídat množina MS možných světů
- výrazy, které byly při standardní analýze analyzovány jako kategorie K, jsou analyzovány jako kategorie K/S
- čili výrazy přímo denotují intenze
"Hyperintenzionální" modely významu
Domněnkové věty a intenzionální izomorfismus
- problém s doměnkovými větami jako
Frege se domnívá, že jedna a jedna jsou dvě (1)
- věta jedna a jedna jsou dvě je matematickou pravdou a protože matematické pravdy nezávisejí na stavu světa, bude extenzí této věty v každém možném světě pravdivostní hodnota P; a její intenzí tedy bude konstantní funkce přiřazující P každému možnému světu
- tatáž funkce ale zřejmě bude intenzí jakékoli matematické pravdy, např.
Existuje nekonečně mnoho prvočísel
- takže podle intenzionální analýzy by nemohlo nastat, že by byla například věta (1) pravdivá, zatímco věta (2) nepravdivá
Frege se domnívá, že existuje nekonečně mnoho prvočísel (2)
- to se zdá být v rozporu s intuicí: zdá se, že Frege může (v nějakém jiném možném světě, když ne v tom našem) docela dobře vědět, že jedna a jedna jsou dvě, a současně se mylně domnívat, že prvočísel je jenom konečně mnoho
- řešení pomocí hyperintenzionální sémantiky
- jemnější sémantická analýza
- myšlenka, že je-li intenze výrazu výsledkem nějaké kombinace intenzí jeho částí, pak bychom význam v intuitivním slova smyslu neměli explikovat jako výslednou intenzi, ale jako nějakou formu zachycení samotného procesu kombinace
Teorie strukturovaných významů
- nejjednodušší variantou realizace hyperintenzionální sémantiky
- ztotožnění denotátu složeného výrazu s uspořádanou n-ticí tvořenou denotáty jeho částí
Tichého konstrukce
- n-tice jsou jakési ‚konstrukce‘, které mají primárně co dělat nikoli s tím, jak se věci spojují v rámci světa, ale spíše s tím, jak uživatelé jazyka kombinují významy částí ve významy celků
Situační sémantika
Dynamické modely významu
Problémy anaforické reference
- význam zájmen, např. on
- individuum, které zájmeno pojmenovává, není určeno možným světem, ale spíše kontextem
- dynamická sémantika postavena na pojmu kontextu či informačního stavu
- výroky v jejím rámci jsou chápány jako denotující nikoli pravdivostní hodnoty či funkce z možných světů do pravdivostních hodnot, ale funkce z informačních stavů do informačních stavů, tzv. přechody (updates)
Teorie reprezentace diskurzu (DRT)
- opírá se o struktury podobné situacím, nazývané struktury reprezentace diskurzu, avšak soustředí se především na jejich ‚kinematiku‘
- v rámci DRT jsou kontexty či informační stavy uchopeny jako ‚reprezentované situace‘ a věta je chápána jako prostředek přebudování takové reprezentace na nějakou reprezentaci bohatší
Dynamická logika
- van Benthem (1997)
Vybrané speciálnější problémy sémantiky
Různý počet doplnění slovesa
- obecně lze jednoduchou větu nahlédnout jako sloveso (které může být modifikováno různými ‚příslovečnými určeními‘) spojené s různými druhy jmenných doplnění (podmětem, ‘předměty‘)
- počet jmenných doplnění slovesa se může větu od věty měnit (přičemž absence některých z nich může znamenat absenci příslušných argumentů na úrovni sémantiky, zatímco absence jiných jenom jejich nevyjádřenost)
Karel přednáší posluchačům báseň (3) Karel přednáší posluchačům (4) Karel přednáší báseň (5)
- několik možností reprezentace
- spojuje-li se totéž sloveso s různým počten argumentů, jde o případ homonynie a je tedy v pořádku, že pro jeho analýzu musíme v každém případě použít jiný predikát (s jinou aritou)
- můžeme pracovat s formálním jazykem, jehož predikáty mohou mít proměnný počet argumentů (nebo jejichž argumenty nejsou přímo označeními individuí, ale označeními třeba množin individuí)
- strom znázorňující strukturu věty převést na logickou formuli takovým způsobem, že by se uzly staly termy a označení hran by se stalo predikáty
- z věty (5) by se stalo $ Act(Prednaset,Karel) \wedge Obj(Prednaset,Basen) $
Východisko a jádro věty
- z hlediska dynamiky diskurzu je ve větě třeba rozlišit část, kterou se věta ‘ukotvuje v kontextu‘ (východisko, to jest specifikace toho, o čem se hovoří) od části, která přináší skutečně novou informaci (jádro výpovědi, to jest vyjádření toho, co se o tom říká)
- pro východisko věty je charakteristický předpoklad existence
- Český král je logik - spíše než nepravda je tato věta ne úplně smysluplný výrok, protože není jasné, o čem se vůbec mluví (Česko nemá krále)
- pro jádro je zase charakteristický předpoklad reprezentativnosti
- pokud bude odpověd na otázku Kde se mluví Německy? třeba V Hamburku, bude to odpověď, která sice není nesprávná, ale není reprezentativní (německy se mluví i na jiných místech, např. v Mnichově)
Odkazy
- stručná skripta k předmětu Úvod do teoretické sémantiky jsou ve Studnici
Státnice -- Matematická lingvistika
Složitost a vyčíslitelnost -- Tvorba algoritmů, Odhady složitosti, NP-úplnost, Aproximační algoritmy, Vyčíslitelné funkce, Rekurzivní množiny, Nerozhodnutelné problémy, Věty o rekurzi.
Datové struktury -- Stromy, Hašování, Dynamizace, Vnější paměť, Třídění.
Formální popis jazyka -- Závislostní syntax, Frázové gramatiky, Obecná lingvistika, FGD, Formální sémantika
Statistické metody -- Korpusy, Strojové učení, Stochastické metody, Experimenty
Automatické zpracování jazyka -- Analýza jazyka, Generování jazyka, Analýza a syntéza řeči, Extrakce informací, Strojový překlad