Intelektualinės virtualios mokymo(si) sistemos: Markovo sprendimo priėmimo proceso taikymas
Straipsniai
Dalia Baziukaitė
Klaipėdos universitetas
Publikuota 2004-12-17
https://doi.org/10.15388/LMR.2004.32273
PDF

Kaip cituoti

Baziukaitė, D. (2004) “Intelektualinės virtualios mokymo(si) sistemos: Markovo sprendimo priėmimo proceso taikymas”, Lietuvos matematikos rinkinys, 44(spec.), pp. 797–801. doi:10.15388/LMR.2004.32273.

Santrauka

Straipsnyje aptariamos baigtinio Markovo sprendimo priėmimo proceso taikymo prielaidos virtualioms mokymosi sistemoms intelektualizuoti parodant, jog virtualioje mokymosi sistemoje veikiančių agentų būsenų aibė, agentų priimami sprendimai ir perėjimai iš vienos būsenos į kitą gali būti modeliuojami taikant Markovo sprendimo priėmimo procesų ir sustiprinto mokymosi (Reinforcement-Learning) teori­jos rezultatus. Intelektuali mokymosi sistema suprantama kaip gebanti parinkti optimalų mokymosi kelią besimokančiajam ir koreguoti savo veiksmus atsižvelgdama į laikui bėgant įgytą patyrimą. Sustiprinto mokymosi problemai, optimalios vertės funkcijos V* (x) radimui, spręsti galima taikyti įvairius algoritmus. Vienas jų – tai Q-mokymosi (Q-learning) algoritmas, leidžiantis surasti optimalią Q* (x, a) funkciją. Stochastinės aproksimacijos teoremos sąlygų įvykdymas Q-mokymosi algoritme užtikrina algoritmo konvergavimą į optimalią Q* (x, a), o tai reiškia ir į optimalią vertės funkciją V* (x).

PDF
Kūrybinių bendrijų licencija

Šis kūrinys yra platinamas pagal Kūrybinių bendrijų Priskyrimas 4.0 tarptautinę licenciją.

Atsisiuntimai

Nėra atsisiuntimų.