Keel ja kirjandus 7/1994, lk. 439-441     

 

        Toetus eesti keelele tema olelusvõitluses: Ü. Viksi "Väike vormisõnastik"

 

        Keeled, nagu kõik muugi siin maailmas, osalevad evolutsiooniprotsessis. Nad sünnivad, arenevad ja surevad; ja see on tihedalt seotud nii keeltevälise keskkonna - tehnoloogia ja ühiskonna - muutustega kui ka keelte omavahelise olelusvõitlusega.

        Mõned keeled (õigemini nende kasutajad) on tehnoloogia muutusi osanud enda kasuks rakendada, saavutades nii teiste keelte (kasutajate) suhtes eeliseid. Keeltel, mida kirjutatakse ja (alates 14. sajandist) trükitakse, on püsimajäämise ja arenemise suhtes palju paremad võimalused kui keeltel, mis ei ole kirja ning trükkimiseni jõudnud. Esimesed on kommunikatsiooni ja mõtete väljendamise olulised vahendid, teised on taandunud dialektideks või hoopis kadunud.

        Praegu on toimumas uus murrang tehnoloogias, mis võib mõjutada keelte edasist saatust rohkemgi kui Gutenbergi leiutis omal ajal. Jutt käib arvutustehnika ning elektroonilise infovahetuse mõjust keeltele.

        Juba praegu või lähedases tulevikus on võimalik, et arvuti loeb kirjalikku teksti (ja isegi käsikirja) valjusti ette või kirjutab kõne üles ning tõlgib ühest keelest teise. Juba praegu on võimalik lihtne telefonivestlus inglase ja jaapanlase vahel, kusjuures kumbki räägib oma emakeeles ja tõlkimine toimub automaatselt. See kõik toob kaasa suured muudatused info vahetuses ja kättesaadavuses - aga jällegi ainult nende keelte kõnelejatele, kelle jaoks vastav tehnoloogia on realiseeritud.

        (Vt. ka "Towards a European Language Infrastructure." Report by A. Danzin and the Strategic Planning Study Group for the Commission of the EC. 31. march 1992.)

        Selline on kontekst, mille valgusel tuleb vaadelda Ü. Viksi "Väikest vormisõnastikku" - Tallinn, 1992 (edaspidi VVS).

        VVS on esimene eesti keele spetsiaalne morfoloogiasõnastik, mis on üks grammatikasõnastike alaliike. Morfoloogiasõnastik on tingimata vajalik komponent morfoloogilise analüsaatori ja sünteesiprogrammi tegemisel; morfoloogiline analüüs ja süntees on omakorda esimeseks astmeks lingvistiliselt veidigi keerulisema (ja kasulikuma) arvutiprogrammi loomisel, mis omakorda viib meid lõpuks selle tehnoloogiani, mis inglise ja jaapani keele jaoks on juba olemas. (Morfoloogilise analüsaatori kasutusvõimalustest vt. ka Ü. Viks "Eesti keele morfoloogiline analüsaator." KK 1994, lk. 150 - 163.)

        Võib-olla see, et VVS on koostatud arvutiga, mõeldud arvutiga töötlemiseks ja arvuti abil analüüsimiseks, seletabki VVS-i trüki-versiooni vähest populaarsust "traditsioonilise" lingvistika hulgas. Ma ei tea, kuidas on lugu Eesti kui tervikuga, aga Tartu lingvistiline kultuur näib pidavat VVS-i üheks marginaalseks nähtuseks: TÜ humanitaarraamatukogus ("Seminarkas") pole teda fondiski, avariiulist rääkimata. See on seda kõnekam, et analoogiline vene keele morfoloogiline sõnaraamat, A. Zaliznjaki "Vene keele grammatiline sõnastik", on esindatud lausa kahe erineva väljaande kujul. Ka TÜ raamatukogu teeb analoogilist vahet: Zaliznjak on avariiulil, VVS aga ainult fondis.

        Eeltoodud sapise märkuse aluseks on muuhulgas see, et allakirjutanu ei ole lingvist, vaid kuulub nende hulka, keda võiks tähistada sõnaga "arvuti-inimesed". Ja kuigi Tiit Hennoste veendumuse kohaselt on matemaatika ja lingvistika väga lähedased teadused, tuleks alljärgnevat retsensiooni VVS-i kohta vaadelda kui hinnangut "väljastpoolt" traditsioonilist keeleteadust, mille aluseks on morfoloogia-analüsaatori (valminud TÜ eesti keele tekstikorpuse töörühmas 1993) ja sõnakontrollija EEDI (H-J. Kaalep "EEDI hakkas tööle" - Arvutimaailm Nr. 5 1993, lk. 26 - 27) tegemise kogemus VVS-i elektroonilise variandi alusel.

        VVS koosneb kahest köitest. Esimeses köites (60 lk.) on kirjeldatud sõnastiku aluseks olevaid teoreetilisi seisukohti ja seda, kuidas VVS-i kasutada. See 60 lehekülge on üsna tihe, üksikasjalik ja raskesti loetav. Inimesele, kes on eesti keeles hästi kodus ja kelle ainsaks huviks VVS-i kasutamisel on kontrollida, milline on mõne sõna käänamise/pööramise õige viis, võib 1. köite põhjalikkus tunduda ebavajalik ja tülikas. Kuid kui meid huvitab eesti keele sõnamuutuse süsteem kui selline, siis on põhjalikkus omal kohal. Morfoloogia kirjeldamisel on vaja nii sõnaloendeid kui reegleid: teatud sõnahulgad käänduvad/pöörduvad teatud reeglite alusel. See, millised reeglid me formuleerime, millistesse gruppidesse sõnavara jagame ja millist infot iga sõna juures näitame, ongi see ainus kolme-osaline küsimus, millele sõnamuutuse süsteemi kirjeldaja/esitaja peab vastama. VVS esitab ühe võimaliku vastuse ja on täiesti loomulik, et Ü. Viks seletab ka, miks ta kasutab just neid reegleid ja miks ta jagab sõnad just sellisel moel gruppidesse. Selline põhjendatus teebki VVS-i 1. köite nii keeruliseks ja väärtuslikuks.

        Teine köide (837 lk.) sisaldab sõnastikku ennast ja 4 lisa - 1. Muuttüübid, 2. Liitsõnade ja sõnaühendite seotud komponendid, 3. Liitsõnakomponentide sagedus, 4. Võõrkomponendid. Esimene köide (reeglid) ja teine köide (sõnaloendid) kokku annavadki 36200 sõna ulatuses vastuoludeta süsteemi eesti keele morfoloogia kohta. See, et lisana on antud sõnad muuttüüpide kaupa, on väga heaks allikmaterjaliks näiteks uurijale, kes tahaks eesti keele morfoloogiat kirjeldada mingil muul alusel kui Ü. Viksi klassifikatoorne morfoloogia (kasvõi näiteks K. Koskenniemi 2-tasandilise morfoloogia alusel) või proovida kirjeldada eesti keele morfoloogiat nn. avatud süsteemina (vt. Ü. Viks "Eesti keele morfoloogiline analüsaator" KK 1994, lk. 150-163), kus valdav osa sõnamuutustest on kirjeldatav reeglitega, mis lähtuvad sõna formaalsest struktuurist, ja ainult väike osa sõnadest - erandid - on esitatud loendina.

        Kuna igasugune morfoloogia kirjeldus sisaldab nii reegleid kui sõnaloendeid (koos iga sõna juures oleva infoga), siis tuleb valida, kui palju infot esitada reeglite kujul, kui palju aga sõnastikus. Mida rohkem on (keerulisi) reegleid, seda vähem võib olla iga sõna juures infot sõnastikus, ja vastupidi. Ü. Viks on leidnud selles osas sobiva kompromissi: reeglid on veel piisavalt lihtsad ja ka sõnastik pole üle koormatud. Võrdluseks: A. Zaliznjaki "Vene keele grammatiline sõnaraamat" sisaldab 140 lk. reeglite kirjeldusi ja sõnastikus rohkem erandeid kui VVS, kuigi vene keele morfoloogia on eesti keele omast lihtsam. Morfoloogilise analüsaatori tegemine VVS-i baasil oli igatahes palju lihtsam kui Zaliznjaki alusel (vene keele morfoloogiline analüsaator ja sõnakontrollija valmisid allakirjutanu osavõtul TÜ tehisintellekti laboris 1991. a.), mis tähendab seda, et Ü. Viks kirjeldab eesti keele morfoloogiat paremini kui A. Zaliznjak vene keele oma.

       VVS-i lähtematerjalina on kasutatud "õigekeelsussõnaraamatut" 1976 (õS), kusjuures VVS järgib õS-i fikseeritud norminguid, mida on korrigeeritud vastavalt Vabariikliku õigekeelsuskomisjoni hilisematele otsustele. Seetõttu on VVS praegu kõige adekvaatsem allikas eestikeelsete sõnade käänamise ja pööramise osas.

        VVS-i märksõnastikku on vähendatud spetsiifilisema ja võõrama materjali arvel: välja on jäetud osa terminoloogiast, vähem kasutatavad võõrsõnad, tsitaatsõnad ja -väljendid ning kõige olulisema grupina liitsõnad. Tekib loomulikult küsimus: kas VVS katab pärast kõiki väljajätmisi eesti keelt ikka piisavalt? Selgub, et katab küll. VVS-i alusel tehtud eesti keele automaatse morfoloogilise analüsaatori ja sõnakontrollijaga olen analüüsinud suurt hulka tekste, nii omaenda tööalaseid (ettekandeid, artikleid) kui ka TÜ eesti keele tekstikorpuse praeguseks arvutisse sisestatud tekste (u. 300 000 sõna).

        Tekstis esinevatest leksikalistest elementidest, mida morfoloogiline analüsaator peaks olema võimeline analüüsima, jäävad VVS-i kasutamisel analüüsimata:

        1) Liitsõnad

        2) Regulaarsete tuletiste abil saadud sõnad

        3) Pärisnimed (nii isiku- kui geograafilised)

        4) Lühendid

        Kaks viimast gruppi on sellised, mida ükski sõnastik ei saagi ammendavalt kajastada, saati siis VVS, mille põhiülesandeks on eesti keele sõnamuutuse süsteemi kirjeldamine, mitte kõikvõimalike sümboljadade esitamine, mis eestikeelsetes tekstides võivad esineda.

        Ka esimese ja teise grupi sõnu ei saa ükski sõnastik ammendavalt kajastada, kuid nende puhul annab VVS lähtealused äratundva ja analüüsiva algoritmi tegemiseks. Kui meid huvitab, kuidas sõnu tuletatakse, siis on hea, kui meil on käepärast need minimaalsed "klotsid", millest keerulisemaid üksusi kokku pannakse. On oluline, et VVS-i sõnastiku-osa sisaldab ainult lihtsõnu, varustades meid seega vajalike "klotsidega". Lisaks on VVS-i 2. köites lisad 2, 3 ja 4, mis kirjeldavad liitsõnade komponente ning nende sagedusi ja on hindamatuks lähtematerjaliks igaühele, keda huvitab liitsõnade vormiline külg. Neile, keda huvitab sõnatuletus sufiksi abil, võib soovitada hoolikalt tutvuda 1. köite lk. 58-60, kus on suurepärane formaalne reeglistik regulaarsete tuletuste kohta.

        Liitsõnade väljajätmine VVS-ist võimaldas VVS-i elektroonilise variandi põhjal väga lihtsalt kindlaks teha järgmise seaduspärasuse:

        1) üheski VVS-i (ja ilmselt siis üldse eestikeelses) lihtsõnas ei esine tähekombinatsiooni "zh";

        2) tähekombinatsioon "sh" esineb ainult järgmistes lihtsõnades: "disharmoonia", "ekshibitsionism", "ishias", "pasha" ja nende tuletistes.

"Ishias" võiks olla ka "issias" (nagu O. Lutsu "Suves"), "pasha" võiks olla "paasa" (nagu Piiblis), "disharmoonia" on eesliitega sõna. Seega "z" asemel võiks päris rahulikult kasutada "zh" ja "s" asemel "sh", ilma et hääldused segamini läheks (liitsõnade, nagu "kaashäälik", puhul tagab õige häälduse valiku siis muidugi vaid see, et me tunneme ära, et tegu on liitsõnaga).

         VVS sisaldab väga vähe trüki- või näpuvigu: ainult sõnade "kalifeed" ja "atma" sõnastiku-info on vigane, samuti ei luba VVS sõnavormi "lähme" (aga kas peaks? ma ei tea...). Ka 1. köites toodud kirjeldus vastab peaaegu absoluutselt sellele, mida 2. köites võib leida (kirjelduse vastavus tegelikkusele on üldjuhul väga haruldane asi, nagu teame igasuguste kasutusjuhendite ja tootekirjelduste põhjal). Ainus mittevastav asi on see, et tüvevariandid on esitatud sõnastikus lühendatult, kuid mõnedel juhtudel ei ole 1. köite lk. 16 antud reeglite formaalsel rakendamisel võimalik verbide, mille lõpus on "-elema", lühendatud tüvevariandist korrektset tüve leida. Kõik ülaltoodud näpuvead on sellised, et inimesest kasutaja neid vaevalt üldse märkabki; nad tulid välja VVS-i automaatsel töötlemisel arvutiga.

        Lõpetuseks üks mõte pedagoogika vallast. VVS võiks olla heaks allikaks nii eesti keele õppijatele kui õpetajatele. Lisaks sellele, et ta sisaldab kõige viimasemaid norme eesti keele sõnamuutuse osas, sisaldab ta muuttüüpide kirjelduste juures lisaks teabele sõnade muutumismallide kohta ka sinna kuuluvate sõnade arvu ja eraldi lisas 1 ka loendina kõik sõnad muuttüüpide kaupa. Näeme, et valdav osa sõnu kuulub küllaltki vähestesse tüüpidesse; ainult nende käänamise/pööramise reeglid võikski ära õppida, ülejäänud sõnu lugeda aga "ebareeglipärasteks" (nagu inglise verbe) ja kasvõi eraldi pähe tuupida.

        Siin tuleb uuesti esile, kui hea idee oli liitsõnade väljajätmine VVS-ist: erinevate muuttüüpide kaal morfoloogilises reeglistikus (ehkki mitte reaalses sõnakasutuses) ja seega ka vastavate reeglite õppimise "kasu" tuleb selgemini nähtavale.

 

        Heiki-Jaan Kaalep