Tekstų nehomogeniškumo tyrimas naudojant žymeklius
Straipsniai
Monika Lapėnaitė-Gedvilė
Vilnius University, Lithuania
Karolina Piaseckienė
Šiauliai University, Lithuania
Marijus Radavičius
Vilnius University, Lithuania
Publikuota 2015-12-20
https://doi.org/10.15388/LJS.2015.13884
PDF

Reikšminiai žodžiai

statistinė lingvistika
perteklinė sklaida
tikėtinumo nuokrypis
binominė logistinė regresija
funkciniai žodžiai

Kaip cituoti

Lapėnaitė-Gedvilė, M., Piaseckienė, K. and Radavičius, M. (2015) “Tekstų nehomogeniškumo tyrimas naudojant žymeklius”, Lietuvos statistikos darbai, 54(1), pp. 92–100. doi:10.15388/LJS.2015.13884.

Santrauka

Straipsnio tikslas – įvertinti tekstų statistinį nehomogeniškumą pagal funkcinių žodžių ir kitų lingvistinių elementų vartoseną. Atliktas empirinis tyrimas remiasi mokykloms rekomenduojamų suskaitmenintų grožinės literatūros kūrinių biblioteka http://ebiblioteka.mkp.emokykla.lt. Apskaičiuojami sudarytų dažnų žodžių formų ar kitų kalbinių struktūrų rinkinių, juos vadinsime žymekliais, dažnumai tekstų blokuose, jungiančiuose 50 iš eilės einančių sakinių. Pastebėta, kad žymeklių dažnumai blokuose turi ženklią perteklinę sklaidą, palyginti su lingvistikoje įprastu homogeniškumo modeliu. Pasirinktoms žymeklių grupėms parinkti kelių tipų hierarchiniai binominės logistinės regresijos modeliai, naudojantys autoriaus identifikatorių, bloko ilgį ir likusių žymeklių dažnius blokuose kaip aiškinančiuosius kintamuosius, leido paaiškinti didelę dalį pasirinktųjų žymeklių perteklinės sklaidos.

PDF

Atsisiuntimai

Nėra atsisiuntimų.