Šiame straipsnyje nagrinėjama, kaip iš skirtingų kodo reprezentacijų - abstrakčių sintaksės medžių (AST), valdymo srautų grafų (CFG) ir programos priklausomybių grafų (PDG) - išvesti požymiai lemia mašininio mokymosi modelių gebėjimą aptikti programinės įrangos saugumo pažeidžiamumus. Tyrimo tikslas - sistemiškai įvertinti šių reprezentacijų informatyvumą skirtingoms „Common Weakness Enumeration“ (CWE) pažeidžiamumų klasėms. Tyrimo metu nustatyta, kad pritaikius kodo reprezentaciją konkrečiam pažeidžiamumo mechanizmui, ne tik reikšmingai padidėja klasifikavimo tikslumas, bet ir optimizuojami skaičiavimo resursai atsisakant neinformatyvių požymių.

Šis darbas apsaugotas Creative Commons priskyrimo 4.0 viešąja licencija.