Making virtual learning environment more intelligent: application of Markov decision process

Dalia Baziukaitė

doi:10.15388/LMR.2004.32273

Straipsniai

Dalia Baziukaitė

Klaipėdos universitetas

Publikuota 2004-12-17

https://doi.org/10.15388/LMR.2004.32273

PDF

Kaip cituoti

Baziukaitė, D. (2004) “Intelektualinės virtualios mokymo(si) sistemos: Markovo sprendimo priėmimo proceso taikymas”, Lietuvos matematikos rinkinys, 44(spec.), pp. 797–801. doi:10.15388/LMR.2004.32273.

Atsisiųsti citatą

Santrauka

Straipsnyje aptariamos baigtinio Markovo sprendimo priėmimo proceso taikymo prielaidos virtualioms mokymosi sistemoms intelektualizuoti parodant, jog virtualioje mokymosi sistemoje veikiančių agentų būsenų aibė, agentų priimami sprendimai ir perėjimai iš vienos būsenos į kitą gali būti modeliuojami taikant Markovo sprendimo priėmimo procesų ir sustiprinto mokymosi (Reinforcement-Learning) teorijos rezultatus. Intelektuali mokymosi sistema suprantama kaip gebanti parinkti optimalų mokymosi kelią besimokančiajam ir koreguoti savo veiksmus atsižvelgdama į laikui bėgant įgytą patyrimą. Sustiprinto mokymosi problemai, optimalios vertės funkcijos V* (x) radimui, spręsti galima taikyti įvairius algoritmus. Vienas jų – tai Q-mokymosi (Q-learning) algoritmas, leidžiantis surasti optimalią Q* (x, a) funkciją. Stochastinės aproksimacijos teoremos sąlygų įvykdymas Q-mokymosi algoritme užtikrina algoritmo konvergavimą į optimalią Q* (x, a), o tai reiškia ir į optimalią vertės funkciją V* (x).

PDF

Šis kūrinys yra platinamas pagal Kūrybinių bendrijų Priskyrimas 4.0 tarptautinę licenciją.

Atsisiuntimai

Nėra atsisiuntimų.

Skaitomiausi šio autoriaus(ų) straipsniai

Dalia Baziukaitė, Andrius Bielskis, Olegas Ramašauskas, Adaptyvaus mokymosi principų taikymo galimybės e-studijose , Lietuvos matematikos rinkinys: T 42 (2002)
Dalia Baziukaitė, Intelektinės virtualios mokymo(si) aplinkos: programinio agento būsenos atpažinimo problema , Lietuvos matematikos rinkinys: T 45 (2005)