Šiame darbe sprendžiamas emocijų atpažinimo iš tekstinių duomenų uždavinys, taikant skirtingus teksto reprezentavimo metodus ir mašininio mokymosi algoritmus. Tyrime naudoti lingvistiniai požymiai, Bag-of-Words ir TF-IDF metodai bei jų kombinacijos. Klasifikavimui taikyti logistinės regresijos, atraminių vektorių mašinos, Naiviojo Bajeso, atsitiktinių miškų ir XGBoost algoritmai. Geriausi rezultatai gauti derinant Bag-of-Words reprezentaciją su papildomais lingvistiniais požymiais ir naudojant logistinės regresijos modelį (tikslumas ir f1 macro ≈ 0,81). Nustatyta, kad modeliai geriausiai atpažįsta neutralią ir džiaugsmo emocijas, o prasčiausiai – liūdesio.

This work is licensed under a Creative Commons Attribution 4.0 International License.