Regresinės analizės taikymas didiesiems duomenims
Straipsniai
Indrė Baltušninkaitė
Vilniaus Gedimino technikos universitetas
Nomeda Bratčikovienė
Vilniaus Gedimino technikos universitetas
Publikuota 2018-12-20
https://doi.org/10.15388/LJS.2018.5
PDF

Reikšminiai žodžiai

didieji duomenys
regresinė analizė
stebinių įtakos indeksu pagrįsta regresija
LASSO
LARS
RMSLE

Kaip cituoti

Baltušninkaitė I. ir Bratčikovienė N. (2018) „Regresinės analizės taikymas didiesiems duomenims“, Lietuvos statistikos darbai, 57(1), p. 56-69. doi: 10.15388/LJS.2018.5.

Santrauka

[straipsnis ir santrauka lietuvių kalba; santrauka anglų kalba]

Šiame straipsnyje nagrinėjamos didžiųjų duomenų regresinės analizės galimybės ir galimi sunkumai. Straipsnyje išskirtos ir paaiškintos pagrindinės juos nusakančios charakteristikos, nustatyti galimi iššūkiai, kylantys didžiųjų duomenų analitikoje. Atsižvelgiant į tai, pasiūlyta keletas didžiųjų duomenų regresinėje analizėje naudojamų metodų, kurie leidžia sumažinti skaičiavimų naštą ir atrinkti nepriklausomus kintamuosius, geriausiai nusakančius priklausomą kintamąjį, bei pasiekti didesnį modelio tikslumą. Vienas iš darbo tikslų – metodų pritaikymas realiems didiesiems duomenims, todėl didelis dėmesys skiriamas tiriamajai daliai. Realių duomenų regresijos modelių sudarymui ir parametrų vertinimui naudojami išskaidytos ir stebinių įtakos indeksu paremtos regresijos metodai, o geriausiai priklausomąjį kintamąjį nusakančių nepriklausomų kintamųjų atrinkimui naudojama LASSO ir LARS regresija. Straipsnyje taip pat pateikiami atlikti modelių tinkamumo ir tikslumo vertinimai, jų tarpusavio rezultatų palyginimai.

PDF
Kūrybinių bendrijų licencija

Šis kūrinys yra platinamas pagal Kūrybinių bendrijų Priskyrimas 4.0 tarptautinę licenciją.

Susipažinkite su autorių teisėmis žurnalo politikoje skiltyje Autorių teisės.

Skaitomiausi šio autoriaus(ų) straipsniai