Neapykantos kalbos atpažinimas lietuviškuose komentaruose panaudojant dirbtinį intelektą
Straipsniai
Eglė Kankevičiūtė
Vilniaus universitetas
Milita Songailaitė
Vytauto Didžiojo universitetas
Justina Mandravickaitė
Vytauto Didžiojo universitetas
Publikuota 2023-05-11
https://doi.org/10.15388/LMITT.2023.3
PDF

Kaip cituoti

Kankevičiūtė, E., Songailaitė, M. and Mandravickaitė, J. (2023) “Neapykantos kalbos atpažinimas lietuviškuose komentaruose panaudojant dirbtinį intelektą”, Vilnius University Open Series, pp. 27–34. doi:10.15388/LMITT.2023.3.

Santrauka

Šiame darbe pateikiame neapykantos kalbos aptikimo modelių palyginimą lietuvių kalbai. Neapykantos kalbai aptikti naudojome tris giliojo mokymosi modelius: daugiakalbį BERT, LitLat BERT ir Electra. Visi trys modeliai buvo adaptuoti lietuviškų komentarų klasifikavimui į tris klases: neapykantos, įžeidžią ir neutralią kalbą. Norint adaptuoti modelius atpažinti neapykantos kalbą, buvo parengtas anotuotas duomenų rinkinys, kuriame yra 25 219 lietuviški komentarai. Apmokyti modeliai buvo įvertinti naudojant tikslumo, atkūrimo, preciziškumo ir F1 statistikos metrikas. Geriausiai pasirodė LitLat BERT, kurio F1 statistikos reikšmė buvo 0,72. Antroje vietoje liko daugiakalbis BERT, kurio F1 statistika buvo 0,63, o trečioje vietoje liko Electra, kurio F1 statistika pasiekė 0,55.

PDF

Atsisiuntimai

Nėra atsisiuntimų.

Skaitomiausi šio autoriaus(ų) straipsniai

1 2 3 4 5 > >>