Neapykantos kalbos atpažinimas lietuviškuose komentaruose panaudojant dirbtinį intelektą

Eglė Kankevičiūtė; Milita Songailaitė; Justina Mandravickaitė

doi:10.15388/LMITT.2023.3

Articles

Eglė Kankevičiūtė

Vilnius University

Milita Songailaitė

Vytautas Magnus University

Justina Mandravickaitė

Vytautas Magnus University

Published 2023-05-11

https://doi.org/10.15388/LMITT.2023.3

PDF

Keywords

dirbtinis intelektas
teksto klasifikavimas
neapykantos kalba
transformerių neuroniniai tinklai

Abstract

Šiame darbe pateikiame neapykantos kalbos aptikimo modelių palyginimą lietuvių kalbai. Neapykantos kalbai aptikti naudojome tris giliojo mokymosi modelius: daugiakalbį BERT, LitLat BERT ir Electra. Visi trys modeliai buvo adaptuoti lietuviškų komentarų klasifikavimui į tris klases: neapykantos, įžeidžią ir neutralią kalbą. Norint adaptuoti modelius atpažinti neapykantos kalbą, buvo parengtas anotuotas duomenų rinkinys, kuriame yra 25 219 lietuviški komentarai. Apmokyti modeliai buvo įvertinti naudojant tikslumo, atkūrimo, preciziškumo ir F1 statistikos metrikas. Geriausiai pasirodė LitLat BERT, kurio F1 statistikos reikšmė buvo 0,72. Antroje vietoje liko daugiakalbis BERT, kurio F1 statistika buvo 0,63, o trečioje vietoje liko Electra, kurio F1 statistika pasiekė 0,55.

PDF

References

Downloads

Download data is not yet available.

Most read articles by the same author(s)

Veronika Bryskina, Milita Songailaitė, Justina Mandravickaitė, Evaluating Bias Detection in Lightweight LLMs , Vilnius University Open Series: 2026: Proceedings of the Conference "Lithuanian MSc Research in Informatics and ICT"