Skenavimo duomenų klasifikavimas pagal COICOP 2018 klasifikatorių yra svarbus etapas siekiant panaudoti šiuos duomenis vartotojų kainų indeksų skaičiavimams, todėl dėl didelės duomenų apimties aktualu sumažinti rankinio klasifikavimo poreikį. Šiame darbe analizuoti Lietuvos didžiųjų prekybos centrų skenavimo duomenys, kurie buvo paversti į vektorinę reprezentaciją taikant TF – IDF metodą, ir tada taikyti logistinės regresijos, atraminių vektorių bei fastText klasifikatoriai, atliktas jų palyginimas ir tinkamumas šiems duomenims klasifikuoti.

Šis darbas apsaugotas Creative Commons priskyrimo 4.0 viešąja licencija.