English

Koondkorpus: Eesti ilukirjandus 1990-

Sisu ja maht

Selles allkorpuses on eesti algupärased ilukirjandustekstid, kokku ca 5,8 miljonit sõna. Valdav enamus tekstidest on avaldatud pärast 1990. aastat. Täpse info korpuses sisalduvate tekstide kohta leiate siit tabelist.

NB! Suur osa nendest ilukirjandustekstidest kuulub ka Tasakaalus korpuse koosseisu!

Kogu korpus on vaba kasutamiseks mitteärilistel eesmärkidel. Kasutamiseks on kolm võimalust:

Märgendus

Nii allalaaditavates failides kui ka kasutajaliidese kaudu kasutatavates failides on kirjavahemärgid sõnadest lahku tõstetud. s.o. kirjas tavaline lause

Ma nägin, et ta tuleb, ja ütlesin: "Tere!"

on korpuses kujul

Ma nägin , et ta tuleb , ja ütlesin : " Tere !"

Allalaaditavad failid on märgendatud TEI põhimõtete järgi.

Allalaaditavate korpuseversioonide struktuur on järgmine:

Kasutajaliideste kaudu kasutatavates korpuseversioonides lause = rida. Märgendus on kustutatud, v.a. märgend <gap ...>. Iga lause algab allikaviitega, kus kirjas info teose autori ja pealkirja kohta.

SGML-olemid

SGML-failides esinevad olemid on kirjas selles tabelis


Valid XHTML 1.0! Valid CSS! Veebisepp   Viimati muudetud: N, 20. detsember 2018 18:09 UTC.