Šiame straipsnyje analizuojamas gilaus skatinamojo mokymosi (DRL) pritaikymas autonominiam automobilio valdymui simuliuotoje 2D lenktynių trasoje. Tyrimo metu lyginami du skirtingi įvesties duomenų tipai: spindulių pagrindu veikianti sistema, naudojanti atstumo iki trasos kraštų matavimus ir automobilio būsenos duomenis, bei vaizdo pagrindu veikianti sistema, apdorojanti aplink automobilį esančius vaizdus. Agentų mokymui naudojamas DDQN algoritmas, o jų veiklos efektyvumas vertinamas pagal nuvažiuotą atstumą. Eksperimentai atliekami su trimis skirtingomis mokymosi strategijomis: pradedant nuo trasos pradžios, pradedant atsitiktinėse trasos vietose ir mokant agentą dviejose skirtingose trasose. Tyrimo tikslas – nustatyti, kaip skirtingi įvesties duomenų tipai ir mokymosi strategijos veikia agentų mokymosi efektyvumą.
Šis kūrinys yra platinamas pagal Kūrybinių bendrijų Priskyrimas 4.0 tarptautinę licenciją.