Senųjų raštų rašybos keitimas paieškos sistemai
Straipsniai
Mindaugas Šinkūnas
Lietuvių kalbos institutas
Publikuota 2018-12-20
https://doi.org/10.15388/Proceedings.2018.16
PDF

Reikšminiai žodžiai

tekstynų lingvistika
rašybos
ortografijos normalizavimas
normalizacija
reguliacija
transliteracija

Kaip cituoti

Šinkūnas, M. (2018) Senųjų raštų rašybos keitimas paieškos sistemai, Vilnius University Open Series, (1), p. 389-407. doi: 10.15388/Proceedings.2018.16.

Santrauka

[straipsnis ir santrauka lietuvių kalba; santrauka anglų kalba]

Lingvistinei analizei reikia skaitmeninių tekstų, tinkamų programiniam apdorojimui. Lietuvių kalbos instituto duomenų bazei senieji raštai skaitmeninami laikantis dokumentinio perrašo principų, nekeičiant originalo rašybos. Senoji rašyba dažnai yra variantiška, nenusistovėjusi ir gerokai skiriasi nuo dabartinės, tai trukdo pritaikyti technologijas, kuriamas dabartinei lietuvių kalbai tirti. Straipsnyje aprašomas empirinėmis taisyklėmis paremtas būdas iš žodžių formų senąja rašyba automatiškai sugeneruoti formas dabartine rašyba perraše išlaikant originalios rašybos ypatybes. Sugeneruoti atitikmenys naudojami paieškos sistemoje.

PDF
Kūrybinių bendrijų licencijos
Priskyrimas: Kūrybinių bendrijų licencijos (CC BY 4.0).