Automatinis kalbos dalių žymėjimas (POS) Tartu estų anglų kalbos mokinių tekstyne: mokinių klaidų poveikis CLAWS7 įrankio tikslumui
Articles
Liina Tammekänd
University of Tartu, Estonia
Reeli Torn-Leesik
University of Tartu, Estonia
Publikuota 2023-12-28
https://doi.org/10.15388/Taikalbot.2023.20.9
PDF
HTML

Reikšminiai žodžiai

mokinių anglų kalba
automatinis kalbos dalių žymėjimas (POS)
mokinių kalbos klaidos
Tartu estų anglų kalbos mokinių tekstynas (TCELE)
CLAWS7

Kaip cituoti

Tammekänd, L., & Torn-Leesik, R. (2023). Automatinis kalbos dalių žymėjimas (POS) Tartu estų anglų kalbos mokinių tekstyne: mokinių klaidų poveikis CLAWS7 įrankio tikslumui. Taikomoji Kalbotyra, 20, 126-140. https://doi.org/10.15388/Taikalbot.2023.20.9

Santrauka

Pagrindinis šio darbo, kuris yra Tammekändos ir Torn-Leesikos (2022) tyrimo tęsinys, tikslas buvo ištirti mokinių klaidų įtaką automatizuotam kalbos dalių (POS) žymų priskyrimui naudojant CLAWS7 įrankį. Tyrimas paremtas 24 812 žodžių imtimi; duomenys surinkti iš Tartu estų anglų kalbos mokinių tekstyno (TCELE). Duomenims anotuoti buvo naudojamas CLAWS7 žymų rinkinys, kurį sudaro 137 žodžių žymės. Siekiant įvertinti mokinių klaidų įtaką anotavimo tikslumui, detalesnei analizei buvo atrinkti atvejai, kai mokinio klaidos sutapo su automatinio žymėjimo klaidomis šio tyrimo imtyje. Remiantis tyrime nustatytomis klaidomis, sukurta klaidų taksonomija ir klaidų tipų, turinčių įtakos anotavimo rezultatams, klasifikavimo ir analizės sistema. Siekiant ištirti ryšį tarp besimokančiojo klaidų ir automatinio anotavimo klaidų, automatinio žymėjimo klaidos sistemingai lygintos su mokinių klaidomis, o tai padėjo nustatyti sąsajas ir dėsningumus šiuose dviejuose duomenų rinkiniuose. Kitaip tariant, tyrime buvo siekiama nustatyti klaidų tipus, kurie gali turėti ženklios įtakos automatinio anotavimo klaidoms. Nurodytos galimos priežastys, paaiškinančios tyrime pastebėtą mokinių kalbos klaidų poveikį anotavimo įrankio tikslumui. Taip pat darbe bandyta paaiškinti pagrindinius veiksnius, galimai lėmusius automatinio kalbos dalių žymėjimo klaidas, susijusias su tekste esančiomis mokinių klaidomis.
Tyrimo rezultatai rodo, kad mokinių kalbos klaidų nulemtos CLAWS7 įrankio klaidos sudaro vos 2,8 % visų atvejų. Tačiau rašybos klaidos daro kur kas didesnį poveikį anotavimo tikslumui – įrankis priskyrė neteisingas žymas net 22 % tokių klaidų. Taigi atliktas darbas atskleidė, jog apskritai mokinių klaidos neturi didelės įtakos CLAWS7 įrankio tikslumui, tačiau rašybos klaidos – turi.

PDF
HTML
Kūrybinių bendrijų licencija

Šis kūrinys yra platinamas pagal Kūrybinių bendrijų Priskyrimas 4.0 tarptautinę licenciją.

Atsisiuntimai

Nėra atsisiuntimų.

Skaitomiausi šio autoriaus(ų) straipsniai

1 2 3 4 5 6 7 8 9 10 > >>