Lietuvių kalbos gramatikos informacinė sistema: I morfologija
Straipsniai
Daiva Šveikauskienė
Lietuvių kalbos institutas
Publikuota 2016-12-15
https://doi.org/10.15388/Lietkalb.2016.10.9915
PDF (Anglų)

Reikšminiai žodžiai

gramatika
morfologija
morfemika
informacinė sistema

Kaip cituoti

Šveikauskienė, D. (2016) “Lietuvių kalbos gramatikos informacinė sistema: I morfologija”, Lietuvių kalba, (10), pp. 1–19. doi:10.15388/Lietkalb.2016.10.9915.

Santrauka

Straipsnyje trumpai apžvelgiami latvių, čekų, rusų, anglų kalbų darbai, atlikti morfemikos kompiuterizavimo srityje. Išsamiau nagrinėjami Lietuvoje atlikti šios tematikos darbai. Matematikos ir informatikos institute sukurtoje duomenų bazėje morfemos žymimos skirtingu šriftu. Vytauto Didžiojo universiteto duomenų bazėje morfemos atskiriamos viena nuo kitos brūkšneliais. Informacija tampa klaidinanti, kai vienodai vaizduojami skirtingą morfeminę struktūrą turintys žodžiai.
Lietuvių kalbos morfologinė analizė daro daug klaidų: pateikiami lietuvių kalboje neegzistuojantys žodžiai, neatpažįstama labai daug lietuviškų žodžių, nurodoma, kad tai yra „tekstas ne lietuvių kalba arba gramatiškai neteisingas“. Pateikti vokiečių ir estų kalbų morfologinių analizatorių darbo pavyzdžiai, kurie dėl sutrumpinimų bei ženklų aiškiai skirti tik specialistams. Bene aiškiausiai informaciją pateikia rusų kalbos morfologinis analizatorius.
Straipsnyje aprašyta pradedama kurti lietuvių kalbos gramatikos informacinė sistema, skirta plačiam vartotojų ratui, todėl joje informacija pateikiama labai aiškiai. Taip pat siekiama aukšto duomenų tikslumo bei patikimumo, todėl naudojama apsauga nuo klaidų. Žodžiai į duomenų bazę bus įtraukiami talpinant juos į apibendrintą lietuvių kalbos žodžio formatą.
Vartotojui pateikiama dviejų tipų informacija apie žodį: morfologinė ir morfeminė. Morfologinėje dalyje nurodomi duomenys apie visą žodį – kalbos dalis ir su ja susijusių morfologinių kategorijų gramatiniai požymiai: daiktavardžiui – linksnis, skaičius, giminė ir t.t., veiksmažodžiui – laikas, asmuo, skaičius, nuosaka ir kt. Taip pat nurodoma žodžio pradinė forma, o vediniams bei dūriniams – dar ir pamatiniai žodžiai.
Morfeminėje dalyje vaizdžiai parodoma žodžio struktūra pateikiant ne tik jo suskaidymą į morfemas, bet ir nurodant išsamią informaciją apie kiekvieną morfemą. Skirtingiems morfemų tipams naudojamos kitokios spalvos papildomai pateikiant tikslesnes pačios morfemos charakteristikas, pvz., priesaga: darybinė, kaitybinė, galūnėms: įvardžiuotinė, nutrumpėjusi ir pan.
Straipsnyje pateikiami paveikslėliai su bandomojo pavyzdžio žodžių analizės rezultatais.

PDF (Anglų)

Atsisiuntimai

Nėra atsisiuntimų.