Tikimybinis dažnų posekių paieškos algoritmas
Straipsniai
Julija Pragarauskaitė
Matematikos ir informatikos institutas
Gintautas Dzemyda
Matematikos ir informatikos institutas
Publikuota 2010-12-21
https://doi.org/10.15388/LMR.2010.57
PDF

Reikšminiai žodžiai

dažnų sekų paieška
tikimybinis algoritmas
duomenų gavyba

Kaip cituoti

Pragarauskaitė, J. and Dzemyda, G. (2010) “Tikimybinis dažnų posekių paieškos algoritmas”, Lietuvos matematikos rinkinys, 51(proc. LMS), pp. 313–318. doi:10.15388/LMR.2010.57.

Santrauka

Dažnų posekių paieška didelėse duomenų bazėse yra svarbi biologinių, klimato, finansinių ir daugelio kitų duomenų bazių analizei. Tikslieji algoritmai, skirti dažnų posekių paieškai, daug kartų perrenka visą duomenų bazę. Jeigu duomenų bazė didelė, tai paieška yra lėta arba reikalingi superkompiuteriai. Straipsnyje pasiūlytas naujas tikimybinis dažnų posekių paieškos algoritmas, kuris analizuoja tam tikru būdu sudarytą pradinės duomenų bazės atsitiktinę imtį. Remiantis šia analize daromos statistinės išvados apie dažnus posekius pradinėje duomenų bazėje. Šis algoritmas nėra tikslus, tačiau veikia daug greičiau negu tikslieji algoritmai ir tinka žvalgomajai statistinei analizei. Klaidų tikimybės įvertinamos statistiniais metodais. Tikimybinis algoritmas gali būti derinamas su tiksliaisiais dažnų posekių paieškos algoritmais.

PDF

Atsisiuntimai

Nėra atsisiuntimų.