Eelmine teema   Tagasi sisukorda   Järgmine teema


2. Leksikonid keele teoreetilistes mudelites

Kirjandus: [3], [9]

Leksikoni mõiste, nagu ka leksikonis esitatava materjali ja selle esitusviisi ideed on arvutuslingvistikas arenenud teoreetilises keeleteaduses toimunud arengu otsesel mõjul.

Leksikoni all keelemudelis mõistetakse keelekirjelduse komponenti, milles on esitatud keele leksikaalsed üksused (lexical entries) - milleks valdavalt, ehkki mitte alati on sõnad - ning iga leksikaalse üksuse kirjes on esitatud sellele üksusele spetsiifiline fonoloogiline, morfoloogiline, süntaktiline, semantiline ning pragmaatiline info. Leksikoni mõiste teoreetilises keeleteaduses on arenenud eelkõige generatiivse grammatika (GG) ja sellest väljakasvanud teooriate raames. Vaatleme selle arengu põhiliine, mis on relevantsed arvutileksikoloogiale.

Algvariant. GG esimeses variandis, mille N. Chomsky esitas “Süntaktilistes struktuurides”, leksikon üldse puudus. Leksikon keelemudeli omaette komponendina kinnistus nn “Aspektide” mudelis, mille N. Chomsky esitas 1965.a. “Süntaksiteooria aspektides”. Leksikoni lisamiseks andis põhilise tõuke semantikakomponendi lülitamine GG-sse. Grammatikalt nõuti, et see genereeriks mitte ainult vormiliselt korrektseid, vaid ka tähenduslikult mõttekaid lauseid. Ehkki leksikonis esitati iga sõna juures süntaktilisi (nt sõnaliik, selle alajaotused) kui ka semantilisi andmeid, mõjutas leksikoni mõiste edasist arengut eelkõige leksikonis sõnade kohta esitatava semantilise info ulatus ja organisatsioon.

Aspektide”mudelis kasutati tunnusjoonte süsteemi, kus tunnused olid varustatud märgiga “+” või “-“, vastavalt nende esinemisele või mitteesinemisele sõna kirjes:

±ELUS, ±VEDEL jne.

Neid kasutades võidi vältida nt lause Kivi jõi kaks raamatut genereerimine, sest kivi kirje ei sisalda jooma subjektilt nõutud tunnust +ELUS ja raamatu kirje ei sisalda jooma objektilt nõutud tunnust +VEDEL.

Leksikon ja lause semantiline esitus. Kui algvariandis oli GG semantikakomponendi ülesanne vaid tähenduslikult mõttetute lausete elimineerimine, siis GG järgmisel perioodil 70. aastatel püstitati ülesanne, et semantikakomponent peab andma lause täieliku ja ammendava semantilise kirjelduse. Siit tulenes nõue. Et leksikonis peab sisalduma iga leksikaalse üksuse tähenduse ammendav kirje. Oli tarvis uut esitusviisi ning selle aluseks sai predikaatarvutuse formalism. Seniseid tunnusjooni interpreteeritakse predikaatidena ning iga predikaadi juures on osutatud argumendid, mille kohta see predikaat kehtib (vt Semantiline analüüs: Tähenduste esitamise formaalsed keeled). Tunnusjoonte loendi asemel on sõna semantiline kirje nüüd tüüpiliselt üksteisesse sisestatud predikaatavaldistest moodustuv struktuur. Näiteks sõna tapma (täpsemini väljendi keegi (X) tapab kellegi (Y)) tähenduse esitus on semantiliselt järgmine:

PÕHJUSTAMA (X, MUUTUMA (Y), MITTE (ELUS (Y))))

Ehk: X põhjustab, et Y muutub mitte-elusaks. X ja Y on muutujad, mille väärtusteks saavad vastavalt predikaadi tapma subjekti- ja objektipositsioonis olevate nimisõnafraaside kirjed. Niisugune tähenduse esitus leksikonis võimaldab lause süntaktilisest struktuurist ja leksikonist lähtudes konstrueerida lause sidusa semantilise esituse.

Argumentide semantilised rollid. Järgmiseks sammuks semantikakomponendi arengus oli argumentide semantiliste funktsioonide e. rollide sissetoomine. Näiteks lausetes Poiss lükkas ukse lahti ja Tuul lükkas ukse lahti on poiss ja tuul subjektina erinevates semantilistes rollides. Poiss on tõlgendatav tahtliku tegijana e. AGENDINA, tuul saab olla vaid mittetahtlik põhjustaja e. INSTRUMENT. Semantiliselt on see oluline erinevus, ja lähteks on sõna lükkama tähendusega määratud argumentide rollid, mille kohta vajalik info tuleb esitada leksikonis. Lähtutakse ideest, et põhimõtteliselt on võimalik defineerida universaalne semantiliste rollide loend, mida predikaatide argumendid võivad täita. Ehkki rollide loendis pole erinevad uurijad kokkuleppele jõudnud, on idee ise juurdunud kõigis olulisemates keelekontseptsioonides.

Leksikonipõhised keelekontseptsioonid. Alates 1970. - 80. aastate vahetusest on leksikoni roll keeleteoreetilistes kontseptsioonides pidevalt kasvanud. See puudutab mitte ainult semantilist, vaid ka süntaktilist komponenti. Infot, mida varem esitati süntaksikomponendis reeglitega, leiti olevat otstarbekas esitada leksikonis leksikaalsete üksuste kirjetes. Seda arenguliini esindavad eelkõige leksikaalne funktsionaalne grammatika (Lexical-Functional Grammar e. LFG) ja üldistatud fraasistruktuurigrammatika (Generalized Phrase Structure Grammar e. GPSG), mis on tuntu unifikatsioonigrammatikate klassi esindajatena. Unifikatsioonigrammatikates on põhiline grammatiline ja semantiline info koondunud leksikoni. Iga sõna iseloomustatakse grammatiliste ja semantiliste tunnuste komplektiga, millele rakendatakse unifitseerimist. Valdavaks esitusviisiks on nn. tüpiseeritud tunnuste struktuurid, mis koosnevad tunnustest ja nende võimalikest väärtustest. Põhimõtteliselt on see predikaatidest-argumentidest koosnevate struktuuride edasiarendus. Lähemalt vt kursuse "Sissejuhatus arvutuslingvistikasse" teemasid "Tunnused ja tunnuste struktuurid" ja "Üldistatud tunnuste struktuurid ja unifikatsioonigrammatikad".


Tagasi peatüki algusse