Heiki-Jaan Kaalep
- E-mail:
- heiki-jaan.kaalep@ut.ee
- Birth date:
- May 19, 1962
- Position:
- Senior reseacher
- Research interests:
- computer linguistics (morphology), corpus linguistics, and language technology
- Education:
-
- Cybernetics of economy, University of Tartu
1980-85
- M. Sc. in Computer science 1992
- Ph. D. in general linguistics 1999
Courses:
Publications
2010
- Kaalep, H.-J.; Muischnek, K.; Uiboaed, K.; Veskis, K. The Estonian Reference Corpus: its composition and morphology-aware user interface The Fourth International Conference HUMAN LANGUAGE TECHNOLOGIES : THE BALTIC PERSPECTIVE, Riga, Latvia, October 7-8, 2010, 143 - 146 Last draft: pdf file
- Kaalep, H.-J. Mitmuse osastav eesti keele käändesüsteemis Keel ja Kirjandus, 2, 94 - 111 pdf fail
- Kaalep, H.-J.; Koit, M. Kuidas masin tõlgib Keel ja Kirjandus, 10, 724 - 738 pdf file
- Fishel, K.; Kaalep, H.-J. CorporAl: a Method and Tool for Handling Overlapping Parallel Corpora The Prague Bulletin of Mathematical Linguistics, 94, 67 - 76. pdf file
- Muischnek, K.; Kaalep, H.-J. The variability of multi-word verbal expressions in Estonian. Language Resources and Evaluation, 44, 1-2, 115 - 135. pdf file
2009
- Kaalep, H.-J.; Muischnek, K. Eesti keele püsiühendid arvutilingvistikas: miks ja kuidas. Eesti Rakenduslingvistika Ühingu Aastaraamat, 5, 157 - 172. pdf file
- Kaalep, H.-J. Kuidas kirjeldada lühikest sisseütlevat kasutusandmetega kooskõlas? Keel ja Kirjandus, 6, 411 - 425. pdf file
2008
- Kaalep, H.; Mikk, J. Creating specialised dictionaries for foreign language learners: a case study. International Journal of Lexicography, 21(4), 369 - 394. pdf file
- Kaalep, H.-J.; Mikk, J. Põhikooli ainesõnastikud. Keel ja Kirjandus, 10, 790 - 802. pdf file
- Fishel, M.; Kaalep, H.-J. Experiments on Processing Overlapping Parallel Corpora. In: Proceedings of the International Conference on Language Resources and Evaluation: Marrakech, Morocco; 28.-30.05.2008. Marrakech, Morocco:, 2008. pdf file
- Kaalep, H.-J.; Muischnek, K. Multi-Word Verbs of Estonian: a Database and a Corpus. In: Proceedings of the LREC Workshop Towards a Shared Task for Multiword Expressions: Marrakech; Morocco; 1. juuni 2008. , 2008, 23 - 26. pdf file
2007
-
Kaalep, H.-J. Veskis, K.
Comparing Parallel Corpora and Evaluating their Quality.
MT Summit XI Proceedings: Machine Translation Summit XI. Copenhagen, Denmark,
ed. Bente Maegaard,
Kopenhaagen, Taani,
2007
pp. 275 - 280
doc file
pdf file
-
Fishel, M. Kaalep, H.-J. Muischnek, K.
Estonian-English machine translation: the first results.
Proceedings of the 16th Nordic Conference of Computational Linguistics NODALIDA-2007.
ed. Nivre, J. Kaalep, H.-J. Muischnek, K. Koit, M.
University of Tartu: Tartu,
2007
pp. 278 - 283.
pdf file
2006
-
Kaalep, H.-J. Muischnek, K.
Multi-word verbs in a flective language: the case of Estonian.
Proceedings of the EACL workshop on Multi-word expressions in a multilingual context: 11th Conference of the European Chapter of the Association for Computational Linguistics; Trento, Italy; 3 April 2006
Rayson, P. Sharoff, S. Adolphs, S.
Association for Computational Linguistics,
2006
pp. 57 - 64.
doc file
pdf file
2005
-
Kaalep, H.-J. Muischnek, K.
The corpora of Estonian at the University of Tartu: the current situation.
Proceedings of the Second Baltic Conference on Human Language Technologies.
Institute of Cybernetics, Tallinn University of Technology.
Institute of the Estonian Language.
Tallinn
2005
pp. 267-272 pdf fail
2004
-
Hiie Asser, Heiki-Jaan Kaalep, Siret Linnas, Jaan Mikk, Kadri Muischnek, Merje Songe, Heli Uibo
Õpikute keerukuse analüüs arvutitel.
TPedÜ Eesti filoloogia osakonna
toimetised 3. Toimiv keel II.
Töid rakenduslingvistika alalt
toim. Maria-Maren Sepper, Jane Lepasaar,
TPÜ
kirjastus,
Tallinn
2004
pp. 72-84
doc file
pdf file
postscript file
-
Heiki-Jaan Kaalep, Kadri Muischnek.
Frequency Dictionary of Written Estonian
of the 1990ies.
In:
The First Baltic Conference. Human Language
Technologies. The Baltic Perspective.
Commission of the Official Language at
the Chancellery of the President of Latvia,
Riga,
2004
pp. 57-60
doc file
pdf file
postscript file
-
Heiki-Jaan Kaalep
Keeping the Speller Lexicon up-do-date for an Inflective Language In: 1st Workshop on International Proofing Tools and Language
Technologies.
Pre-Proceedings,
Patras, Greece,
2004
doc file
pdf file
postscript file
2003
-
Kaalep, H-J., Muischnek, K.
Inconsistent Selectional Criteria in
Semi-automatic Multi-word Unit Extraction.
COMPLEX 2003, 7th Conference
on Computational Lexicography and Corpus Research,
Ed. By F. Kiefer, J.Pajzs,
Research Institute for Linguistics, Hungarian Academy of
Sciences,
Budapest
2003,
pp. 27-36
rtf file, pdf file, postscript file
-
Kaalep, H-J., Muischnek, K.
Püsiühendite leidmine suurtest
tekstikorpustest.
Eesti Keele Instituudi toimetised 12.
Toimiv keel I
Töid rakenduslingvistika alalt.
Eesti Keele Sihtasutus
Tallinn
2003
pp. 101-118
pdf file
-
Mikk, J., Kaalep, H.-J., Asser, H., Linnas, S., Songe, M.
Käsikirjade
arvutianalüüs õpikute koostamisel.
In:
K. Karlep, E. Krull
(toimetajad).
Haridus kõigile.
TÜ Kirjastus,
Tartu
2003,
pp. 99 - 107
-
Kadri Muischnek, Heili Orav, Heiki-Jaan Kaalep, Haldur Õim.
Eesti keele
tehnoloogilised ressursid ja vahendid. Arvutikorpused, arvutisõnastikud,
keeletehnoloogiline tarkvara.
Eesti Keele Sihtasutus,
Tallinn
2003
pdf file
-
Martin Ehala, Heiki-Jaan Kaalep, Annika Kilgi, Ülle Viks.
Morfoloogia
In:
Emakeele Seltsi Aastaraamat 48,
Tallinn
2003,
pp. 36-48
ISBN
9985-9421-1-6
ISSN 0206-3735
pdf file
2002
-
Kaalep, H-J., Muischnek, K.
Eesti kirjakeele sagedussõnastik
TÜ
kirjastus,
Tartu
2002,
205 lk
-
Kaalep, H-J., Muischnek, K.
Using the Text Corpus to Create a Comprehensive List of
Phrasal Verbs
Proceedings LREC 2002. Third Intern. Conf. on Language Resources and
Evaluation.
M.G. Rodrķguez, C.P. Suarez Araujo
1. kd
pp. 101-105
doc file,
pdf file,
postscript file
-
Kaalep, H-J., Muischnek, K.
Püsiühendite leidmine teksti abil.
In: Tähendusepüüdja
Catcher
of the Meaning”,
TÜ üldkeeleteaduse õppetooli toimetised 3,
Tartu
2002,
pp. 172-184
Toimetamata variant: doc file,
pdf file,
postscript file
-
Dias, G., Kaalep, H-J.
Automatic Extraction of Multiword
Units for Estonian: Phrasal Verbs.
In: H.Metslang, M.Rannut (eds)
Languages in Development, Lincom-Europa, München, Linguistic Edition 41
2002
doc file, pdf file, postscript file
2001
-
Dias, G., Kaalep, H-J., Muischnek, K.
Automatic Extraction of Verb
Phrases from Annotated Corpora: A Linguistic Evaluation for
Estonian
Association for Computational Linguistics. 39th Annual Meeting and 10th Conference of the European Chapter. Workshop
proceedings: Collocation: Computational Extraction, Analysis and
Exploitation
Institut de Recherche en Informatique de Toulouse and Universite des Sciences Sociales.
Toulouse, France,
2001,
pp. 47-53. rtf file, pdf file, postscript file
-
Dias, G., Kaalep, H-J., Muischnek, K.
Automatic Extraction of Verbal
Locutions for Estonian: Validating Results with Pre-existing Phrasal
Lexicons.
Teoses
COMPLEX 2001. 6th Conference on Computational Lexicography and Corpus Research "Computational Lexicography and New EU Languages".
Centre for Corpus Linguistics. Department of English. University of Birmingham
2001,
pp. 75-82.doc file, pdf file, postscript file
2000
-
H.-J. Kaalep, K. Muischnek, K. Müürisep, A. Rääbis, K. Habicht.
Kas tegelik tekst allub eesti keele
morfoloogilistele kirjeldustele? Eesti kirjakeele testkorpuse
morfosüntaktilise märgendamise kogemusest.
Keel ja Kirjandus
9 2000,
pp. 623-633 doc file, pdf file, postscript file
-
Heiki-Jaan Kaalep, Tarmo Vaino.
Teksti täielik
morfoloogiline analüüs lingvisti töövahendite
komplektis.
In: "
Arvutuslingvistikalt inimesele"
Tartu
2000
lk 87 - 99Toimetamata variant: doc file, pdf file, postscript file
-
Tiit Hennoste, Heiki-Jaan Kaalep, Kadri Muischnek, Leho Paldre, Tarmo Vaino.
The Tartu University Corpus of Estonian Literary Language.
Congressus Nonus Fenno-Ugristarum Pars IV,
lk 337-344,
Tartu
2001. Toimetamata variant: doc file, pdf file, postscript file
-
Heiki-Jaan Kaalep, Tarmo Vaino.
Complete Morphological Analysis in the Linguist’s Toolbox.
Congressus Nonus Internationalis Fenno-Ugristarum Pars V,
lk 9-16,
Tartu
2001. Toimetamata variant: rtf file, pdf file, postscript file
1999
-
Heiki-Jaan Kaalep
Eesti keele ressursside loomine ja
kasutamine keeletehnoloogilises arendustöös.
Diss. phil.
Estonicae univ. Tartuensis.
TÜ Kirjastus 1999 doc file, pdf file, postscript file
-
Leho Paldre, Heiki-Jaan Kaalep, Tarmo Vaino.
Unix as the Interface of an On-line Text Corpus.
Proceedings of the Workshop: Multilingual
Language Technologies,
Ljubljana,
1999. doc file, pdf file, postscript file
1998
-
Heiki-Jaan Kaalep.
Tekstikorpuse abil loodud eesti keele
morfoloogiaanalüsaator.
Keel ja Kirjandus
1
1998,
lk 22-29. Toimetamata versioon: rtf file, pdf file, postscript file
-
Heiki-Jaan Kaalep, Tarmo Vaino.
Kas vale meetodiga õiged
tulemused? Statistkale tuginev eesti keele morfoloogiline
ühestamine.
Keel ja Kirjandus
1
1998,
lk 30-38. Toimetamata versioon: rtf file, pdf file, postscript file
-
Ludmila Dimitrova, Tomaz Erjavec, Nancy Ide, Heiki-Jaan Kaalep,
Vladimir Petkevic, Dan Tufis.
Multext-East: Parallel and Comparable
Corpora and Lexicons for Six Central and Eastern European languages.
COLING-ACL '98, Proceedings of the Conference,
1,
pp. 315-319 pdf file.
-
Heiki-Jaan Kaalep, Rene Prillop, Epp Ehasalu.
The Role of Internet
in Creating, Financing and Integrating Language Resources.
Proceedings of the First International Conference on Language
Resources and Evaluation.
Granada,
1998. 2,
lk 1149-1152. doc file, pdf file, postscript file
kuni 1997
-
Heiki-Jaan Kaalep.
An Estonian Morphological Analyser and
the Impact of a Corpus on Its Development.
Computers and the
Humanities
31
pp. 115-133,
1997. rtf file, pdf file, postscript file
-
Heiki-Jaan Kaalep.
Toetus eesti keelele tema olelusvõitluses: Ü. Viksi Väike vormisõnastik.
Keel ja kirjandus
7 1994,
pp. 439-441 rtf file, html file.
Popular science
-
Kaalep H-J.
Keeletehnoloogia - mis see on.
Arvutimaailm
nr. 7
1994
pp. 54-55
rtf file, htm file
-
Kaalep H-J., Roosmaa T.
Eesti keel, tehnoloogia ja tulevik.
Postimees
nr. 235 11. okt.
1994
pp. 14
rtf file, htm file
-
Kaalep H-J.
Virtuaalne ingliskeelne Eesti.
Kultuurileht
1998
doc file, htm file
-
Kaalep H-J.
Keeleusk ja tehnoloogiahullus.
Päevaleht
15.01.
2002
doc file, htm file
Webmaster
Last modified: October 27 2010 17:24:19.