English

Heiki-Jaan Kaalep

Heiki-Jaan

Uuemat infot vt:ETIS

Publikatsioonid

2022

  1. Kaalep, Heiki-Jaan; Pirinen, Flammie; Moshagen, Sjur Nørstebø You can’t suggest that?! Comparisons and improvements of speller error models. Nordlyd 46, 1 2022, lk. 125 - 139 pdf fail
  2. Kaalep, Heiki-Jaan Looking into Estonian Syllabification Baltic J. Modern Computing 10 2022, lk. 348 - 359 pdf fail

2021

  1. Kaalep, Heiki-Jaan Verbi algvorm ja teised vormid Keel ja Kirjandus 6 2021, lk. 510 - 531 pdf fail
  2. Kaalep, Heiki-Jaan Raamat õigekeele sõnamuutmisest Keel ja Kirjandus 4 2021, lk. 350 - 355 pdf fail

2018

  1. Kaalep, Heiki-Jaan Statistika koht keelemudelis Keel ja Kirjandus 8-9 2018, lk. 713−727 pdf fail
  2. Kaalep, Heiki-Jaan; Moshagen, Sjur Nørstebø; Trosterud, Trond Estonian Morphology in the Giella Infrastructure. Human Language Technologies – The Baltic Perspective Ed. Muischnek, Kadri; Müürisep, Kaili IOS Press 2018, lk. 47–54 pdf fail
  3. Kaalep, Heiki-Jaan Parallel Forms in Estonian Finite State Morphology Proceedings of the 4th International Workshop for Computational Linguistics for Uralic Languages Association for Computational Linguistics, 2018, lk. 141–155 pdf fail

2017

  1. Orasmaa, Siim; Kaalep, Heiki-Jaan; Can We Create a Tool for General Domain Event Analysis? Proceedings of the 21st Nordic Conference on Computational Linguistics, NoDaLiDa 21 Ed. Jörg Tiedemann Linköping University Electronic Press Linköping 2017, lk. 192–201 pdf fail

2016

  1. Kaalep, Heiki-Jaan Kas Google on ühe-või kahesilbiline sõna? Keel ja Kirjandus 1 2016, lk. 28–40 pdf fail
  2. Orasmaa, Siim; Petmanson, Timo; Tkatšenko, Aleksandr; Laur, Sven; Kaalep, Heiki-Jaan EstNLTK – NLP Toolkit for Estonian. Proceedings of the Tenth International Conference on Language Resources and Evaluation (LREC 2016) Ed. Nicoletta Calzolari (Conference Chair) and Khalid Choukri and Thierry Declerck and Marko Grobelnik and Bente Maegaard and Joseph Mariani and Asuncion Moreno and Jan Odijk and Stelios Piperidis ELRA Portorož, Slovenia 2016, lk. 2460–2466 pdf fail

2015

  1. Kaalep, Heiki-Jaan Eesti verbi vormistik. Keel ja Kirjandus 1 2015, lk. 1–15 pdf fail
  2. Kaalep, Heiki-Jaan Estonian Morphology: What is Learned and How? Unpublished pdf fail

2014

  1. Valdre, E.; Ross, P.; Tsepelina, K.; Veskis, K.; Vaino, T.; Kaalep, H.-J. Radioloogiauuringute vastuste lühendite ja lühendamise korpuslingvistiline analüüs. Eesti Arst, 93 (9) 2014, lk. 502–512 pdf fail

2013

  1. Kaalep, Heiki-Jaan Keelelise küsitluse tõlgendamise ohud Keel ja Kirjandus 6 2013, lk. 440–446 pdf fail

2012

  1. Kaalep, Heiki-Jaan; Muischnek, Kadri Osalausete tuvastamine eestikeelses tekstis kui iseseisev ülesanne. Eesti Rakenduslingvistika Ühingu aastaraamat 8 Toim. Helle Metslang, Margit Langemets, Maria-Maren Sepper Eesti Rakenduslingvistika Ühing Tallinn 2012, lk. 55–68 pdf fail
  2. Muischnek, Kadri; Fišel, Mark; Kaalep, Heiki-Jaan; Koit, Mare; Müürisep, Kaili; Orav, Heili; Vare, Kadri; Õim, Haldur Arvutilingvistika ja keeletehnoloogia Tartu Ülikoolis Emakeele Seltsi Aastaraamat 56 Toim. Erelt, Mati; Mäearu, Sirje TA Kirjastus, Tallinn, 2012, lk. 66–102 pdf fail
  3. Kaalep, Heiki-Jaan Käänamissüsteemi seaduspärasused Keel ja Kirjandus 6 2012, lk. 418–449 pdf fail
  4. Kaalep, Heiki-Jaan; Kirt, Riin; Muischnek, Kadri A trivial method for choosing the right lemma. Human Language Technologies – The Baltic Perspective Tavast, Arvi; Muischnek, Kadri; Koit, Mare (Ed.) IOS Press 2012, lk. 82–89 pdf fail
  5. Kaalep, Heiki-Jaan; Muischnek, Kadri Robust clause boundary identification for corpus annotation. Proceedings of the Eight International Conference on Language Resources and Evaluation (LREC'12) Nicoletta Calzolari, Khalid Choukri, Thierry Declerck, Mehmet Uğur Doğan, Bente Maegaard, Joseph Mar (Ed.). ELRA Istanbul, Türgi 2012, lk. 1632–1636 pdf fail

2011

  1. Kaalep, H.-J.; Muischnek, K. Morphological analysis of a non-standard language variety. Proceedings of the 18th Nordic Conference of Computational Linguistics: NODALIDA 18, Riia, Läti, 11-13. mai 2011 Ed. Bolette Sandford Pedersen, Gunta Nešpore, Inguna Skadina lk. 130 - 137 pdf fail
  2. Muischnek, K.; Kaalep, H.-J.; Sirel, R. Korpuslingvistiline lähenemine eesti internetikeele automaatsele morfoloogilisele analüüsile Eesti Rakenduslingvistika Ühingu aastaraamat. Toim. Metslang, H.; Langemets, M.; Sepper, M.-M. Eesti Rakenduslingvistika Ühing Tallinn 2011, lk. 111 − 127 pdf fail

2010

  1. Kaalep, H.-J.; Muischnek, K.; Uiboaed, K.; Veskis, K. The Estonian Reference Corpus: its composition and morphology-aware user interface The Fourth International Conference HUMAN LANGUAGE TECHNOLOGIES : THE BALTIC PERSPECTIVE, Riga, Latvia, October 7-8, 2010, lk. 143 - 146 Viimane mustand: pdf fail
  2. Kaalep, H.-J. Mitmuse osastav eesti keele käändesüsteemis Keel ja Kirjandus, 2, lk. 94 - 111 pdf fail
  3. Kaalep, H.-J.; Koit, M. Kuidas masin tõlgib Keel ja Kirjandus, 10, lk. 724 - 738 pdf fail
  4. Fishel, K.; Kaalep, H.-J. CorporAl: a Method and Tool for Handling Overlapping Parallel Corpora The Prague Bulletin of Mathematical Linguistics, 94, 67 - 76. pdf fail
  5. Muischnek, K.; Kaalep, H.-J. The variability of multi-word verbal expressions in Estonian. Language Resources and Evaluation, 44, 1-2, 115 - 135. pdf fail

2009

  1. Kaalep, H.-J.; Muischnek, K. Eesti keele püsiühendid arvutilingvistikas: miks ja kuidas. Eesti Rakenduslingvistika Ühingu Aastaraamat, 5, 157 - 172. pdf fail
  2. Kaalep, H.-J. Kuidas kirjeldada lühikest sisseütlevat kasutusandmetega kooskõlas? Keel ja Kirjandus, 6, 411 - 425. pdf fail

2008

  1. Kaalep, H.; Mikk, J. Creating specialised dictionaries for foreign language learners: a case study. International Journal of Lexicography, 21(4), 369 - 394. pdf fail
  2. Kaalep, H.-J.; Mikk, J. Põhikooli ainesõnastikud. Keel ja Kirjandus, 10, 790 - 802. pdf fail
  3. Fishel, M.; Kaalep, H.-J. Experiments on Processing Overlapping Parallel Corpora. In: Proceedings of the International Conference on Language Resources and Evaluation: Marrakech, Morocco; 28-30.05.2008. Marrakech, Morocco:, 2008. pdf fail
  4. Kaalep, H.-J.; Muischnek, K. Multi-Word Verbs of Estonian: a Database and a Corpus. In: Proceedings of the LREC Workshop Towards a Shared Task for Multiword Expressions: Marrakech; Morocco; 1. juuni 2008. , 2008, lk. 23 - 26 pdf fail

2007

  1. Kaalep, H.-J. Veskis, K. Comparing Parallel Corpora and Evaluating their Quality. MT Summit XI Proceedings: Machine Translation Summit XI. Copenhagen, Denmark, toim. Bente Maegaard, Kopenhaagen, Taani, 2007, lk. 275 - 280 doc fail pdf fail
  2. Fishel, M. Kaalep, H.-J. Muischnek, K. Estonian-English machine translation: the first results. Kogumikus: Proceedings of the 16th Nordic Conference of Computational Linguistics NODALIDA-2007. toim. Nivre, J. Kaalep, H.-J. Muischnek, K. Koit, M. University of Tartu: Tartu, 2007 lk. 278 - 283. pdf fail

2006

  1. Kaalep, H.-J. Muischnek, K. Multi-word verbs in a flective language: the case of Estonian. Proceedings of the EACL workshop on Multi-word expressions in a multilingual context: 11th Conference of the European Chapter of the Association for Computational Linguistics; Trento, Italy; 3 April 2006 Rayson, P. Sharoff, S. Adolphs, S. Association for Computational Linguistics, 2006 lk. 57 - 64. doc fail pdf fail

2005

  1. Kaalep, H.-J. Muischnek, K. The corpora of Estonian at the University of Tartu: the current situation. Proceedings of the Second Baltic Conference on Human Language Technologies. Institute of Cybernetics, Tallinn University of Technology. Institute of the Estonian Language. Tallinn 2005 lk. 267-272 pdf fail

2004

  1. Hiie Asser, Heiki-Jaan Kaalep, Siret Linnas, Jaan Mikk, Kadri Muischnek, Merje Songe, Heli Uibo Õpikute keerukuse analüüs arvutitel. TPedÜ Eesti filoloogia osakonna toimetised 3. Toimiv keel II. Töid rakenduslingvistika alalt toim. Maria-Maren Sepper, Jane Lepasaar, TPÜ kirjastus, Tallinn 2004, lk. 72-84 doc fail pdf fail postscript fail
  2. Heiki-Jaan Kaalep, Kadri Muischnek. Frequency Dictionary of Written Estonian of the 1990ies. Kogumikus: The First Baltic Conference. Human Language Technologies. The Baltic Perspective. Commission of the Official Language at the Chancellery of the President of Latvia, Riga, 2004 lk. 57-60 doc fail pdf fail postscript fail
  3. Heiki-Jaan Kaalep Keeping the Speller Lexicon up-do-date for an Inflective Language Kogumikus 1st Workshop on International Proofing Tools and Language Technologies. Pre-Proceedings, Patras, Kreeka, 2004 doc fail pdf fail postscript fail

2003

  1. Kaalep, H-J., Muischnek, K. Inconsistent Selectional Criteria in Semi-automatic Multi-word Unit Extraction. COMPLEX 2003, 7th Conference on Computational Lexicography and Corpus Research, Ed. By F. Kiefer, J.Pajzs, Research Institute for Linguistics, Hungarian Academy of Sciences, Budapest 2003, lk. 27-36 rtf fail, pdf fail, postscript fail
  2. Kaalep, H-J., Muischnek, K. Püsiühendite leidmine suurtest tekstikorpustest. Eesti Keele Instituudi toimetised 12. Toimiv keel I Töid rakenduslingvistika alalt. Eesti Keele Sihtasutus Tallinn 2003 lk. 101-118 pdf fail
  3. Mikk, J., Kaalep, H.-J., Asser, H., Linnas, S., Songe, M. Käsikirjade arvutianalüüs õpikute koostamisel. Kogumikus K. Karlep, E. Krull (toimetajad). Haridus kõigile. TÜ Kirjastus, Tartu 2003, lk. 99 - 107
  4. Kadri Muischnek, Heili Orav, Heiki-Jaan Kaalep, Haldur Õim. Eesti keele tehnoloogilised ressursid ja vahendid. Arvutikorpused, arvutisõnastikud, keeletehnoloogiline tarkvara. Eesti Keele Sihtasutus, Tallinn 2003 pdf fail
  5. Martin Ehala, Heiki-Jaan Kaalep, Annika Kilgi, Ülle Viks. Morfoloogia Kogumikus: Emakeele Seltsi Aastaraamat 48, Tallinn 2003, lk. 36-48 ISBN 9985-9421-1-6 ISSN 0206-3735 pdf fail

2002

  1. Kaalep, H-J., Muischnek, K. Eesti kirjakeele sagedussõnastik TÜ kirjastus, Tartu 2002, 205 lk
  2. Kaalep, H-J., Muischnek, K. Using the Text Corpus to Create a Comprehensive List of Phrasal Verbs Proceedings LREC 2002. Third Intern. Conf. on Language Resources and Evaluation. M.G. Rodriguez, C.P. Suarez Araujo 1. kd lk. 101-105 doc fail, pdf fail, postscript fail
  3. Kaalep, H-J., Muischnek, K. Püsiühendite leidmine teksti abil. Kogumikus Tähendusepüüdja Catcher of the Meaning”, TÜ üldkeeleteaduse õppetooli toimetised 3, Tartu 2002, lk. 172-184 Toimetamata variant: doc fail, pdf fail, postscript fail
  4. Dias, G., Kaalep, H-J. Automatic Extraction of Multiword Units for Estonian: Phrasal Verbs. In: H.Metslang, M.Rannut (eds) Languages in Development, Lincom-Europa, München, Linguistic Edition 41 2002 doc fail, pdf fail, postscript fail

2001

  1. Dias, G., Kaalep, H-J., Muischnek, K. Automatic Extraction of Verb Phrases from Annotated Corpora: A Linguistic Evaluation for Estonian Association for Computational Linguistics. 39th Annual Meeting and 10th Conference of the European Chapter. Workshop proceedings: Collocation: Computational Extraction, Analysis and Exploitation Institut de Recherche en Informatique de Toulouse and Universite des Sciences Sociales. Toulouse, France, 2001, lk. 47-53. doc rtf, pdf fail, postscript fail
  2. Dias, G., Kaalep, H-J., Muischnek, K. Automatic Extraction of Verbal Locutions for Estonian: Validating Results with Pre-existing Phrasal Lexicons. Teoses COMPLEX 2001. 6th Conference on Computational Lexicography and Corpus Research "Computational Lexicography and New EU Languages". Centre for Corpus Linguistics. Department of English. University of Birmingham 2001, lk. 75-82.doc fail, pdf fail, postscript fail

2000

  1. H.-J. Kaalep, K. Muischnek, K. Müürisep, A. Rääbis, K. Habicht. Kas tegelik tekst allub eesti keele morfoloogilistele kirjeldustele? Eesti kirjakeele testkorpuse morfosüntaktilise märgendamise kogemusest. Keel ja Kirjandus 9 2000, lk. 623-633 doc fail, pdf fail, postscript fail
  2. Heiki-Jaan Kaalep, Tarmo Vaino. Teksti täielik morfoloogiline analüüs lingvisti töövahendite komplektis. Kogumikus " Arvutuslingvistikalt inimesele" Tartu 2000 lk 87 - 99Toimetamata variant: doc fail, pdf fail, postscript fail
  3. Tiit Hennoste, Heiki-Jaan Kaalep, Kadri Muischnek, Leho Paldre, Tarmo Vaino. The Tartu University Corpus of Estonian Literary Language. Congressus Nonus Fenno-Ugristarum Pars IV, lk 337-344, Tartu 2001. Toimetamata variant: doc fail, pdf fail, postscript fail
  4. Heiki-Jaan Kaalep, Tarmo Vaino. Complete Morphological Analysis in the Linguist’s Toolbox. Congressus Nonus Internationalis Fenno-Ugristarum Pars V, lk 9-16, Tartu 2001. Toimetamata variant: rtf fail, pdf fail, postscript fail

1999

  1. Heiki-Jaan Kaalep Eesti keele ressursside loomine ja kasutamine keeletehnoloogilises arendustöös. Diss. phil. Estonicae univ. Tartuensis. TÜ Kirjastus 1999 doc fail, pdf fail, postscript fail
  2. Leho Paldre, Heiki-Jaan Kaalep, Tarmo Vaino. Unix as the Interface of an On-line Text Corpus. Proceedings of the Workshop: Multilingual Language Technologies, Ljubljana, 1999. doc fail, pdf fail, postscript fail

1998

  1. Heiki-Jaan Kaalep. Tekstikorpuse abil loodud eesti keele morfoloogiaanalüsaator. Keel ja Kirjandus 1 1998, lk 22-29. Toimetamata versioon: rtf fail, pdf fail, postscript fail
  2. Heiki-Jaan Kaalep, Tarmo Vaino. Kas vale meetodiga õiged tulemused? Statistkale tuginev eesti keele morfoloogiline ühestamine. Keel ja Kirjandus 1 1998, lk 30-38. Toimetamata versioon: rtf fail, pdf fail, postscript fail
  3. Ludmila Dimitrova, Tomaz Erjavec, Nancy Ide, Heiki-Jaan Kaalep, Vladimir Petkevic, Dan Tufis. Multext-East: Parallel and Comparable Corpora and Lexicons for Six Central and Eastern European languages. COLING-ACL '98, Proceedings of the Conference, 1, lk. 315-319 pdf fail.
  4. Heiki-Jaan Kaalep, Rene Prillop, Epp Ehasalu. The Role of Internet in Creating, Financing and Integrating Language Resources. Proceedings of the First International Conference on Language Resources and Evaluation. Granada, 1998. 2, lk 1149-1152. doc fail, pdf fail, postscript fail

kuni 1997

  1. Heiki-Jaan Kaalep. An Estonian Morphological Analyser and the Impact of a Corpus on Its Development. Computers and the Humanities 31 lk. 115-133, 1997. rtf fail, pdf fail, postscript fail
  2. Heiki-Jaan Kaalep. Toetus eesti keelele tema olelusvõitluses: Ü. Viksi Väike vormisõnastik. Keel ja kirjandus 7 1994, lk. 439-441 rtf fail, html fail.

Publitsistika

  1. Kaalep H-J. Netikeele kirjakeelestumine. Sirp 15.12. 2017 veebifail, pdf fail
  2. Kaalep H-J. Keeletehnoloogia - mis see on. Arvutimaailm nr. 7 1994 lk. 54-55 rtf fail, htm fail
  3. Kaalep H-J., Roosmaa T. Eesti keel, tehnoloogia ja tulevik. Postimees nr. 235 11. okt. 1994 lk. 14 rtf fail, htm fail
  4. Kaalep H-J. Virtuaalne ingliskeelne Eesti. Kultuurileht 1998 doc fail, htm fail
  5. Kaalep H-J. Keeleusk ja tehnoloogiahullus. Päevaleht 15.01. 2002 doc fail, htm fail

Valid XHTML 1.0! Valid CSS! Veebisepp   Viimati muudetud: R, 30. detsember 2022 11:27 UTC.