Muzikos garso šaltinių atskyrimo giliojo mokymosi modelio SCNet apmokymas skirtingais duomenų rinkiniais
Straipsniai
Aidas Žygas
Vilniaus universitetas
Gražina Korvel
Vilniaus universitetas
Publikuota 2025-05-12
https://doi.org/10.15388/MITT.2025.34
PDF

Kaip cituoti

Žygas, A. and Korvel, G. (2025) “Muzikos garso šaltinių atskyrimo giliojo mokymosi modelio SCNet apmokymas skirtingais duomenų rinkiniais”, Vilnius University Open Series, pp. 297–304. doi:10.15388/MITT.2025.34.

Santrauka

Šiame straipsnyje nagrinėjama, kaip skirtingi duomenų rinkiniai (Musdb18-HQ, Moisesdb), naudojami muzikos garso šaltinių atskyrimo modelio apmokymui, lemia SCNet modelio išvesties rezultatus. Modelio efektyvumas vertinamas SDR kiekybine metrika, pagal skirtingus muzikos žanrus ir garso šaltinius. Modelis geriausiai atskiria būgnus ir vokalus, jį apmokius su Musdb18-HQ, o naudojant Moisesdb, geriausiai atskiria bosus ir būgnus. Kai modelio apmokymui ir įvertinimui naudojami skirtingi duomenų rinkiniai, SDR rodikliai tampa mažesni, nes modelis juos prasčiau apibendrina. Pastebėta, kad modeliui yra sudėtinga atskirti roko muzikos žanrą, o geriausi SDR pasiekti bliuzo ir kantri žanruose.

PDF
Kūrybinių bendrijų licencija

Šis kūrinys yra platinamas pagal Kūrybinių bendrijų Priskyrimas 4.0 tarptautinę licenciją.

Atsisiuntimai

Nėra atsisiuntimų.