Sparčiai augant saulės elektrinių skaičiui, didėja ir poreikis efektyviai analizuoti jų veikimo duomenis. Visgi duomenų analizę dažnai apsunkina nevienodas matavimo kintamųjų žymėjimas, kylantis dėl skirtingų įrangos gamintojų, montuotojų ar lokalizacijos. Šiame darbe siūloma automatizuota kintamųjų klasifikavimo metodika, leidžianti standartizuoti žymas pasitelkiant natūralios kalbos apdorojimo technikas ir mašininio mokymosi algoritmus. Tyrime panaudoti duomenys iš 178 saulės elektrinių, o kiekvienas įrašas buvo susietas su viena iš 176 klasių pagal specialiai sukurtą septynių komponentų žymėjimo sistemą. Modelių mokymui buvo suformuoti skaitiniai požymiai, įskaitant TF-IDF reikšmes, matavimo vienetų kodavimą ir kontekstinius požymius, gautus kaimynystės analizės būdu. Rezultatai parodė, kad siūlomi modeliai pasiekia itin didelį klasifikavimo tikslumą (daugeliu atvejų virš 99,9 %), o geriausi rezultatai gauti naudojant sprendimų medžio ir atsitiktinių miškų metodus.
Šis kūrinys yra platinamas pagal Kūrybinių bendrijų Priskyrimas 4.0 tarptautinę licenciją.