Eelmine teema   Tagasi sisukorda   Järgmine teema


7. Eesti keele korpused

Tartu ülikooli tekstikorpuse töörühma tekstikogum jaguneb kahte ossa. Selle keskmeks on tekstikorpus kui allkorpuste süsteem, lisaks sellele on arvutis kättesaadavad BNS uudiste tekstikogu, mis sisaldab jooksvaid tekste alates aastast 1994 ja varsti loodetavasti ka ajalehe ‘Postimees’ võrguväljaanded alates aastast 1995.

 

Eesti tänapäeva kirjakeele korpus

Selle kohta palun lugege järgmisi artikleid: Tiit Hennoste, Tartu University Corpus of Written Estonian: A Survey of the Structure of Texts and Principles of Selection. Estonian in the Changing World. Edited by Haldur Õim. Tartu 1996

Tiit Hennoste, Kadri Muischnek, Helen Potter; Tiit Roosmaa, Tartu Ülikooli eesti kirjakeele korpus: ülevaade tehtust ja probleemidest. Keel ja Kirjandus 1993 lk 587-600.

 

Ajalehtede ja ilukirjanduse (monitor)korpused 60ndatest, 50ndatest ja 30ndatest aastatest

Vanema eesti kirjakeele korpus

Kaasaegse suulise kõne korpus on koostamisel.

Plaan: dialektid ja sotsiolektid

Plaan: välis-eesti keele korpused

Muud plaanid: lastekeel, tõlkekeel

 

Eestikeelne materjal paralleelkorpustes

SCLOMB - projekti eesmärgiks on koostada Läänemere-äärsete keelte paralleelkorpus. Igast keelest püütakse valida 1 algupärand ja teistest keeltest selle tõlked. Eesti algupärand on Viivi Luige "Ajaloo ilu".

Projekti MULTEXT raames on loodud paralleelkorpus, mis sisaldab George Orwelli romaani "1984" originaali ja selle tõlkeid kaheksasse keelde, nende hulgas ka eesti keelde.


Tagasi peatüki algusse